第2世代EPYCプロセッサーを発表
7月に第3世代RyzenとNAVI 10ベースのRadeon RX 5700シリーズが発売されたわけだが、これに続き8月7日に第2世代EPYCプロセッサーが発表された。速報記事もあるが、それより細かく説明したい。
第2世代EPYCは、Zen2コアのCPUチップレットを最大8個と、14nmで製造されるI/Oチップレットを搭載する9コアのMCM構成である、という話は昨年11月に連載484回で解説した通りである。
コアそのものはRyzen 3000シリーズと同じZen2コアなので、第516回で説明した内容はそのまま第2世代EPYCにも通用する。
異なるのはI/Oチップレットの構造である。実はこのI/Oチップレットに関しては完全にはすべての構造が説明されているわけではない(8月18日~20日に開催されるHotChips 31でAMDも講演を予定しているので、あるいはここで詳細が語られるかもしれない)のだが、一応今回説明されている範囲で解説しよう。
まず下の画像が9ダイの接続図である。ポイントは3つ。
1)I/OチップレットとCPUチップレットの間のリンクは48Byte/サイクルのインフィニティー・ファブリックで接続される。このリンクの速度はFCLKで決まる。
Ryzenの例で言えば、DDR4-3733まではMCLKと同期するという話であり、DDR4-3200を利用する場合であれば800MHzとなり、帯域は38.4GB/秒(リード25.6GHz+ライト12.8GHz)となる計算だ。初代EPYCではリード/ライトともに最大でも10.67GHz(DDR4-2666対応)だったので、合計でも21.3GB/秒でしかなかった。
2)Socket構成の場合、初代EPYCはPCI ExpressレーンのPHYを転用する形で接続することになっていたが、第2世代EPYCでは18GT/秒×2の接続用PHY(各々16レーン)が4ch用意される。うち2つはSATA接続も兼用しているので、必ずしも全レーンを利用しない場合もあるが、仮に全レーンを接続に利用した場合、18G×2×16レーン×4ch=288GB/秒もの帯域で接続されることになる。
3)DDR4は8chのまま据え置きである。ただ、初代EPYCの際には、市場に出ている最大容量のDRAMチップは8Gbitで、両面実装にしてDIMMあたり最大でも128GB。これを8ch/16スロットにフルに埋めると2TBが最大であった。ところが現在は16Gbitチップが出荷開始されており、これを利用すると同じ8ch/16スロットでも最大で4TBの容量が可能になる。これを前提に、最大容量は4TBとされている(*1)。
ところで最後のメモリーの件、連載第484回で16chにするのでは? と予測したのだが、意外にも8chで据え置きであった。
これについてはイベント後の質疑応答の際にダイレクトに「なぜ16chにしなかったのか」と聞いたのだが、「なぜ16chにしなかったのか」に対する直接的な答えはない代わりに「8chといってもメモリー容量は倍になり、スピードもあがり(DDR4-2666→DDR4-3200)、なにより3次キャッシュの容量がトータルで4倍になった。これのお陰で、DDR4のチャネルを倍増しなくても十分に性能が確保できている。実際ベンチマーク結果を見ると(コア数に応じて)性能がスケールしている」という返事であった。この性能の話は後述する。
(*1) 後で確認したところ、初代EPYCでもBIOSアップデートをかければ技術的には4TBメモリーを利用可能とのこと。技術的には、というのはマザーボードメーカーがそうしたBIOSをリリースするかどうかは不明だからとのこと。
この連載の記事
-
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 - この連載の一覧へ