前回に引き続き、AMDが開催したオンラインイベント“AMD Accelerated Data Center Premiere”の内容を説明していこう。今回はGenoaとBergamo、ついでにTurinの話も少々していく。
Zen 4アーキテクチャーを採用する
GenoaとBergamo
まずは、今後のAMD CPUロードマップの話である。次の世代は以前から説明があったGenoaであるが、こちらは5nmプロセスに移行する。つまりTSMCのN5であるが、これは2倍のトランジスタ密度と2倍の性能/消費電力比、1.25倍の性能を発揮するとされている。
この5nmを利用するのがZen 4アーキテクチャーで、これはGenoaとして以前から名前は上がっていた。そのGenoaであるが、最大96コアで、DDR5とPCIe 5.0/CXLに対応、さらに機能拡張されたセキュリティー機能を搭載するとされ、2022年中に市場投入を予定しているという話だが、すでに顧客にサンプル出荷も開始している、という話が今回正式に語られた。
さて問題はこれに加えて発表されたBergamoである。今後のニーズは以下のとおり。
- General Purpose Computing:汎用Computing向け。Milan→Genoa
- Technical Computing:計算主体で大量のメモリーアクセスをするもの。Milan X(これもそのうちGenoa-Xなどがありそう)
- Accelerated Computing:GPGPU向け。Radeon Instinct MI200シリーズ
これらはいいとして、Clound Native、つまりスケールアウト的に利用する高密度サーバー向けのコアが別途必要、というのがAMDの考え方である。
従来AMDやインテルは、これを「有効コア数と動作周波数・消費電力で分ける」という形で対応してきていた。例えばEPYC 7003シリーズで言うなら、ハイ・パフォーマンスを狙う用途はEPYC 75F3のようにコア数を半減させ、TDPも280Wまで引き上げて、その代わりBase 2.95GHz/Max 4GHz動作を可能にする一方、クラウド向けの高密度サーバーにはEPYC 7713のようにコア数を増やしながら動作周波数はBase 2GHz/Max 3.675GHzと低めにすることで、TDPを225Wに抑えるといった具合だ。ただこの方式には以下の欠点がある。
- 高性能向けの場合、コアを無駄に搭載していることになる。本来32コアなら4ダイ構成でもいけるはずだが、それではL3の合計が128MBに減ってしまう。結局8ダイを搭載し、各々のダイのCPUコアを半分無効化して利用しているため、ダイの利用効率が非常に悪い。
- 高密度向けの場合、高速動作可能なパイプラインを無駄に低速に抑えて消費電力を下げることになっている。最初から高速動作を狙わないのであれば、パイプライン構成や物理実装を高効率/高密度向けに切り替えることでさらに効率が上げられるはずで、逆に言えば現在の構成は効率が悪い。
なんのことはなく、Armのbig.LITTLEやインテルのHybrid Architectureと根っこは同じ話である。そこでZen 4をベースに、これを高効率向けに再設計したものがZen 4cとして発表された。
「高効率」の定義が難しいところではあるが、おそらくは動作周波数は低めに抑え、その代わりにコアのエリアサイズを抑えるとともに、消費電力を低めに抑える工夫がなされると思われる。これを論理設計レベルで行なうか、物理設計レベルで行なうのかで話は変わるが、論理設計レベルではけっこう大変な気がする。
ArmのNeoverse V1とNeoverse N2の場合、論理的に異なるコア(*1)になっているが、これは元のコアが2種類あったから可能な話で、同じことをAMDができるかというとやや怪しいように思う。
なので筆者としては、Zen 4はHigh Speed Libraryを、Zen 4cはHigh Density Libraryをそれぞれ利用する形で物理設計を分けており、この結果としてZen 4cはコア数を128まで増やせたと想像している。
(*1) Neoverse V1はCortex-X2ベース、Neoverse N2はCortex-A710ベースと思われ、この2つはそもそもデコードの同時処理命令数のレベルから異なる。
この連載の記事
-
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ - この連載の一覧へ