Bergamoの構成を推定
1CCXあたり8コアでトータル128コアか?
ところでプラットフォームの話だが、Genoaのパッケージ内部のCGを見る限り、12個のCCD+1個のIODという、Milan世代の基本構成は変わっていないように思える。
まだこのMilan世代のパッケージサイズなどは明らかになっていないが、現行のEPYCと大きく変わらないと考えると、ダイ1つあたりの大きさはやや小さくなっているようだ。
さて問題はBergamoの構成である。おそらくIODはGenoaと共通であろう。なので可能性としては以下の2つのパターンが考えられる。
- 1個のダイに16コアのBergamoが搭載され、これが合計8ダイで128コア
- 1個のダイに8コアのBergamoが搭載され、これが16ダイで128コア
ちなみに1つ目の場合、CCXを16コアまで増やすのか、それともCCXは8コアのまま、2つのCCXを1つのCCDに搭載するのか、という2通りの可能性があるのだが、筆者としてはダイあたり2CCX、1CCXあたり8コアという案を推したいところだ。
さすがに16ダイの搭載は実装コスト的にどうよ? という話ではあるし、そもそもTSMCのN7→N5でトランジスタ密度を倍増できるなら、高密度ライブラリーを使う前提なら、Zen 4cの16コアCCDはZen 3の8コアCCDと同程度のダイサイズに収まるだろう。
ダイとパッケージをつなぐインターコネクトのball(ダイ底面に配される、配線接続用のBGA Ball)の数を確保するためには、あまりダイサイズが小さいのは不利になる。もちろんZen 4cを他の用途(例えばデスクトップ向け)に転用するつもりなら、CCDあたり8コアに留めておく方が有利だろうが、今のところそうした計画が一切聞こえてこないあたりは、CCDあたり16コアでもかまわないように思う。
そしてCCXを1つにするか2つにするかだが、CCXあたり16コアまで拡張すると、おそらく論理設計側にも手を入れる必要があるだろう。もちろんZen 4cが「全く」論理設計に手を入れないか? というとそれはそれで難しいので若干は入るだろうが、CCXの構成そのものは少なくともZen 4/4c世代では手を入れないだろうと筆者は推定している。
以上のことからBergamoは8CCD、1CCDあたり2CCX、1CCXあたり8コアでトータル128コア、という案を提示しておきたい。このBergamo、2023年前半に市場投入とされている。物理設計に1年くらいかかるという昨今のCPUデザインの事情を考えれば、Genoaから1年遅れというスケジュールは非常に納得できるものである。
ちなみにエリアサイズがZen 4とZen 4cでは大きく変わらない(せいぜい4分の3程度)という予測が前提なので、デスクトップにZen 4cは来ないと筆者は予測している。big.LITTLEへの対応ができていないわけではない(*2)が、Armにしてもインテルにしても、bigコアとLITTLEコアの大きさが大きく異なっており、LITTLEコアはbigコアの数分の1(*3)まで縮めないとbig.LITTLEのメリットは生まれにくいように思う。
その見方でいけば、現在のZen 4cは大きすぎるように思う。ちなみに次で触れるが、Zen 4とZen 4c(というよりGenoaとBergamo)ではややSIMD命令周りに差があるかもしれない。
(*2) 例えば2019年12月にAMDは“Method of Task Transition Between Heterogenous Processors”という特許を出願し、2021年に登録されている。
(*3) Alder Lakeで見る限り、E-CoreはP-Coreの4分の1くらいのエリアサイズに見える。
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ