ロードマップでわかる!当世プロセッサー事情 第618回
COMPUTEXで発表した積層技術3D V-Cacheは性能向上と歩留まりを改善する新兵器 AMD CPUロードマップ
2021年06月07日 12時00分更新
3D V-Cacheによる積層で
キャッシュ容量を大幅に増量できる
だいぶ3次元積層技術の話が長くなってしまったが、話を3D V-Cacheに戻す。今回はRyzen 9 5900Xを利用したプロトタイプなので、構造は下図のようになる。2つのCCDの上に、64MBのV-Cacheが載り、これも3次キャッシュ(以下、L3)として利用できるので、プログラムから見るとL3が96MBに増えたように見える構造だ。
実は基調講演終了後に、このV-Cacheに関してTwitterで多数のメンションが飛びまくった。中にいくつか「AMDからの返答をもらった」というものがあったので、筆者も直接「こういうメンションがTwitterで飛んでいるが事実か?」をAMDの広報に確認をして返事をいただいている。それによって以下のことが公式に確認された。
- V-Cacheの構成は1層。容量は64MB。
- V-Cache構成とすることの、放熱に関する影響は軽微である。他の3次元積層の方式と比較しても圧倒的に優れており、従来の2Dシリコンそのままとほとんど差がない。
- V-Cacheのレイテンシーは、CCD上のL3アクセスよりもわずかに増える。ただ一般論としてキャッシュサイズが増えればどうしてもレイテンシーは大きくなり、これはV-Cacheも例外ではない。ただ、64MBのL3増加にともなうDRAMアクセス頻度の低下を考えれば、V-Cacheのレイテンシー増加は問題にならない程度と考えられる。
- V-Cacheの消費電力は大きな影響はない。
- CCDはV-Cacheを積む関係で、薄型化されている。
これをベースにもう少し構成を解説しよう。まず容量の件。下の画像は基調講演における構造図であるが、“64MB L3 cache die”はどう見てももともとのCCDの半分程度の面積しかない。
実際Su CEO自ら「6×6mmのSRAMをCCDの上に載せている」と明言しており、フットプリントは36mm2ということになる。この数字は丸めていると思うので、多少誤差はあるだろう。Zen 3のダイサイズはおおむね80mm2とされるから、ざっくり半分といったところだ。
さて、Zen 3のCCDそのものも、もともと半分くらいの面積をL3に充てていた(下の画像上段)。V-Cacheは、横幅に関してはほぼCCDのL3と同程度で、ただし縦方向はL3+Zen 3コアをはみ出して、インフィニティーファブリックのI/F部あたりまではみ出しているようになっている(下の画像中段)。
ちなみにこの画像ではV-Cacheの全面にTSVが出ているように描画されているが、これは単なる映像効果であって、実際にはこんなに出ていないだろう(上の画像下段)。
問題は「どうやって36mm2に64MB SRAMを押し込めるか」である。CCDのダイ上のL3面積は、画像からもわかるようにおおむね36mm2で32MB SRAMしか構成できない。そもそもSRAMは一番面積を喰うロジック回路であって、MLC NANDフラッシュのように1つのSRAMセルで2bitを記憶する方法がない以上、倍密度にする方法はなかった。
ではこれをどう解決したか?であるが、下図のように32MBのチップを2枚重ねればいい。そしてこの2枚重ねたものを「1層の64MB V-Cache」とAMDは言い張っているのだと思われる。そもそもSoIC自体、3枚以上のチップを積み重ねることを想定しており、こうした構成は難しくないと思われる。
実はこれ、傍証もある。Andreas Schilling氏の6月1日のメンションによれば、AMDのDaytona Platform(第2世代EPYC向けのサーバー向けプラットフォーム)にMilan(第3世代EPYC)対応BIOSをインストールすると、BIOS セットアップにX3Dという項目が出現し、最大4スタックまでの構成が選べるようになるそうだ。
Its always good to have a Daytona platform server at hand ?? https://t.co/wdbCzsHMNHpic.twitter.com/JHjocLN6jP
— Andreas Schilling (@aschilling) June 1, 2021
氏のツイートが本当であるとすれば(これは今のところ確証はない)おろらくこれがV-Cacheで、32MBが1スタック、64MBが2スタック、128MBが4スタックになると思われる。
この連載の記事
-
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ -
第786回
PC
Xeon 6は倍速通信できるMRDIMMとCXL 2.0をサポート、Gaudi 3は価格が判明 インテル CPUロードマップ -
第785回
PC
Xeon 6のIOチップレットには意地でもDDR5のI/Fを搭載しないインテルの強いこだわり インテル CPUロードマップ -
第784回
PC
Intel 3は300~500MHz動作周波数が向上する インテル CPUロードマップ - この連載の一覧へ