Ryzenシリーズの最終回は、3月8日に発表されたNaplesの話をしたい。既報の通り、AMDはNaplesと呼ばれる32コアのサーバー向けCPUの存在を明らかにした。
ちなみに、既報の2枚目のスライドは、Naplesのものではない。これは、かつてOpteronでAMDがサーバー市場に参入した際に、64bit(SledgeHammer)も、Native Multicore(Demmark/Italy/Egypt)も、High Speed Coherent Interconnect(HyperTransport Link)も、メモリーコントローラー統合(SledgeHammer)も、Virtualization(Pacifica:後のAMD-V)も、「全部AMDが先鞭をつけた」ことを紹介しているスライドでしかない。
AMDの次世代サーバーCPU
Naples
それではNaplesとはなにか? というと、1ソケットで32コア/64スレッドのプロセッサーコアと8ch/16枚のDIMM、さらにPCI Expressを合計128レーン利用可能な構成である。ではこれをどう実現しているかを掘り下げてみよう。
そもそも現在のRyzen 7のダイはどんな構造かをまずは見直してみたい。下の画像はAMDが公開したダイショットであるが、これを機能ブロック別にしたのがさらにその下の画像である。
中央の大きな部分は、4コア+3次キャッシュのコアコンプレックスで、これが2つ存在する。そして左上には、おそらくDDR4のI/Fが2ch分用意されている。
おもしろいのは右上と左下で、これがHigh Speed I/Oのメインとなる部分だが、それぞれ32レーン分搭載されているようだ。ただしSerDesだけでなくコントローラも一緒に入っており、8chのものが3つ、4chのものが2つという構成になっている模様だ。
さて、ここまでAMDはコアコンプレックスの中身やコアの中身については公開してきたが、ダイの内部についてはほとんど紹介してきていない。では実際にどんな感じになっているのか? ということで筆者の想像図が下の画像となる。
実際は周辺回路やAPICなど、まだ欠けている要素はいろいろあるのだが、基本的にはコアコンプレックス2つとメモリーコントローラー、それとPCIe/Infinity Fabric用のSerDes(SERializer/DESerializer:パラレル信号とシリアル信号の双方向変換器)がInfinity Fabricで接続されているという構造になっているのではないかと思われる。
ひょっとするとメモリーコントローラーとコアコンプレックスの間には専用の高速バスが搭載されている可能性があるので、これは黄色の破線で示したが、よほどInfinity Fabricの性能が低いのでない限り、おそらくこの専用バスはなしでいいだろう。
実はこの構造は、K8に非常に良く似ている。K8の世代ではマルチプロセッサーに対応するために、メモリーコントローラーをローカルのCPUコアやキャッシュと切り離して、間をクロスバーでつなぐことで、自身のメモリーアクセスと他のノードからHyperTransport Link経由でやってきたメモリーアクセスを同等に扱える工夫がなされているが、おそらくはRyzenのダイにも同じ工夫があると思われる。
前回の記事でScalable Data FabricがHyperTransport Linkに似ているという話があったが、実際Ryzenのダイ内部もInfinity Fabricでコンポーネントが接続されていると考えると、確かに似ているとするのは理解できる。
Ryzen 7やRyzen 5は、2つのコアコンプレックスとメモリーコントローラー、それとSerDes20レーン分(うち16レーンがGPU用、残り4レーンが300シリーズチップセット接続用)が有効にされて提供されている形であろう。
この連載の記事
-
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 - この連載の一覧へ