チップレットに3D積層を組み合わせた
新しいパッケージX3D
次がパッケージ技術で、今後は現在のチップレットに3D積層を組み合わせたX3Dという新しいパッケージを予定していることを明らかにした。
これは別にCPUに限った話ではない。現在のGPUの場合、連載515回で解説したDeffered Renderingの絡みがあるため、チップレット構成のGPUは作りにくい(*)という欠点があるが、GPGPU的な用途であればこうした使い方はあまり一般的ではないから、実はチップレット式にしやすい。
したがって、RDNAの将来製品は引き続き1ダイの構成が続くだろうが、後述するCDNAの将来製品はこのX3Dを使ったパッケージになっても不思議ではない。
あるいはHPC向けのEPYCなども、ローカルに大量のHBM2を4次キャッシュとして搭載することで、メモリー帯域の不足を補うといった使い方も可能になると思われる。
(*) Deferred Renderingでは、一番最後に各チップレットからフレーム全体への参照が発生する関係で、チップレット間の通信が非常に多くなって、ここがボトルネックになる
CPUとGPUの接続も
インフィニティー・ファブリックで相互接続になる
そのGPUであるが、Radeon Instinct向けのInfinityアーキテクチャーはさらに進化することも紹介された。
初代EPYC、つまりNaplesプラットフォームでは4枚のRadeon InstinctをPCIe Gen3で接続する形態だった。
ところが第2世代EPYC、つまりRomeプラットフォームでは、CPUとRadeon Instinctの接続はPCIe Gen4になっただけだが、Radeon Instinct同士はインフィニティー・ファブリックで接続できることは連載485回で紹介した。
これが第3世代EPYCであるMilanプラットフォームでは、CPUとGPUの接続もインフィニティー・ファブリックになることが明らかにされた。
しかもインフィニティー・ファブリック同士が、昔のOpteronのように相互接続可能(これはイメージ図なので、実際はこうはならない可能性もあるが)ということで、大幅に性能が上がることが期待される。
余談だが、このMilanプラットフォームではRadeon InstinctがGPUカードの形をしていないのは、単にスペースが足りないからという可能性もあるが、そもそもインフィニティー・ファブリックを使うならPCIeカードである必要もないわけで、NVIDIAのTesla同様に独自のモジュールでの提供の可能性もありそうに思える。実装面積を抑えるためにも、なにも場所を取って冷却が面倒なPCIeカードを選ぶ必要はないからだ。
ちなみにMilanプラットフォームにおけるインフィニティー・ファブリックの帯域は、現在の2倍になることも明らかにされた。
もう少し先の話をすると、2021年に納入されるスパコンFrontierに加え、2023年にはEl Captainという2 ExaFlopsのマシンをローレンス・リバモア国立研究所に納入することが3月4日に発表された。このEl Captainは次回詳しく解説しよう。
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ