前回に引き続き、AMDが開催したオンラインイベント“AMD Accelerated Data Center Premiere”の内容を説明していこう。今回はGenoaとBergamo、ついでにTurinの話も少々していく。
Zen 4アーキテクチャーを採用する
GenoaとBergamo
まずは、今後のAMD CPUロードマップの話である。次の世代は以前から説明があったGenoaであるが、こちらは5nmプロセスに移行する。つまりTSMCのN5であるが、これは2倍のトランジスタ密度と2倍の性能/消費電力比、1.25倍の性能を発揮するとされている。
この5nmを利用するのがZen 4アーキテクチャーで、これはGenoaとして以前から名前は上がっていた。そのGenoaであるが、最大96コアで、DDR5とPCIe 5.0/CXLに対応、さらに機能拡張されたセキュリティー機能を搭載するとされ、2022年中に市場投入を予定しているという話だが、すでに顧客にサンプル出荷も開始している、という話が今回正式に語られた。
さて問題はこれに加えて発表されたBergamoである。今後のニーズは以下のとおり。
- General Purpose Computing:汎用Computing向け。Milan→Genoa
- Technical Computing:計算主体で大量のメモリーアクセスをするもの。Milan X(これもそのうちGenoa-Xなどがありそう)
- Accelerated Computing:GPGPU向け。Radeon Instinct MI200シリーズ
これらはいいとして、Clound Native、つまりスケールアウト的に利用する高密度サーバー向けのコアが別途必要、というのがAMDの考え方である。
従来AMDやインテルは、これを「有効コア数と動作周波数・消費電力で分ける」という形で対応してきていた。例えばEPYC 7003シリーズで言うなら、ハイ・パフォーマンスを狙う用途はEPYC 75F3のようにコア数を半減させ、TDPも280Wまで引き上げて、その代わりBase 2.95GHz/Max 4GHz動作を可能にする一方、クラウド向けの高密度サーバーにはEPYC 7713のようにコア数を増やしながら動作周波数はBase 2GHz/Max 3.675GHzと低めにすることで、TDPを225Wに抑えるといった具合だ。ただこの方式には以下の欠点がある。
- 高性能向けの場合、コアを無駄に搭載していることになる。本来32コアなら4ダイ構成でもいけるはずだが、それではL3の合計が128MBに減ってしまう。結局8ダイを搭載し、各々のダイのCPUコアを半分無効化して利用しているため、ダイの利用効率が非常に悪い。
- 高密度向けの場合、高速動作可能なパイプラインを無駄に低速に抑えて消費電力を下げることになっている。最初から高速動作を狙わないのであれば、パイプライン構成や物理実装を高効率/高密度向けに切り替えることでさらに効率が上げられるはずで、逆に言えば現在の構成は効率が悪い。
なんのことはなく、Armのbig.LITTLEやインテルのHybrid Architectureと根っこは同じ話である。そこでZen 4をベースに、これを高効率向けに再設計したものがZen 4cとして発表された。
「高効率」の定義が難しいところではあるが、おそらくは動作周波数は低めに抑え、その代わりにコアのエリアサイズを抑えるとともに、消費電力を低めに抑える工夫がなされると思われる。これを論理設計レベルで行なうか、物理設計レベルで行なうのかで話は変わるが、論理設計レベルではけっこう大変な気がする。
ArmのNeoverse V1とNeoverse N2の場合、論理的に異なるコア(*1)になっているが、これは元のコアが2種類あったから可能な話で、同じことをAMDができるかというとやや怪しいように思う。
なので筆者としては、Zen 4はHigh Speed Libraryを、Zen 4cはHigh Density Libraryをそれぞれ利用する形で物理設計を分けており、この結果としてZen 4cはコア数を128まで増やせたと想像している。
(*1) Neoverse V1はCortex-X2ベース、Neoverse N2はCortex-A710ベースと思われ、この2つはそもそもデコードの同時処理命令数のレベルから異なる。
この連載の記事
-
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ