ロードマップでわかる!当世プロセッサー事情 第766回
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ
2024年04月08日 12時00分更新
IODを貫通して直接シリコン・インターボーザーから電力を供給できる
配線に関しては、信号だけでなく電力供給周りもずいぶん苦労したようだ。IODには3ヵ所に電力供給用のTSVが集中的に配置されており、XCDはこれを2+1で、CCDはそれぞれ1つづつ接続する形で配している。
もっとも2+1といっても、2つ上の画像で言えば上段左側のXCDは、この両方を使うわけではなく、片方だけを使っていると思うのだが。このPower TSVに関しては、IODを貫通して直接シリコン・インターボーザーから電力を供給できるような工夫がなされているらしい。
この配線に関して、電力以外はいいのか? という疑問もあるのだが。ただ3D Vキャッシュと異なり、CCDの3次キャッシュとインフィニティ・キャッシュは別に連携しているわけではない(CCDからは4次キャッシュとしてインフィニティ・キャッシュが見えている形になっていると思われる)ので、まだどうにかできるということかもしれない。
このあたりの模式図(ただしMI300X)が下の画像だ。パワープレーンはIODあたり1つになっているようで、MI300Xは2つのXCDで1つのパワープレーンを共用することになる。
電源周りの模式図。MI300Aの場合は、3つのCCDが1つのパワープレーンになるということだ。このあたりはがんばればCCDなりXCDごとにやることも不可能ではないのだろうが、配線の複雑さが増すデメリットもあるので、妥協したのだろう
ただRyzen同様に、オンダイでLDO(Low Drop Out Regurator)による電圧調整は可能だろうし、Power Gatingも可能になっていると思われるので、これはそれほど問題にはならないだろう。ちなみにUSRというのはUltra Short Reachの略で、これはIOD同士の接続の配線の意味である。
あと、冷静に考えれば当然そうなのだが、モバイルチップ的なパワーシェアリングの機能も搭載されていることが説明された。
TDPはMI300Aで760W、MI300Xで750Wとなっており、さすがにすべてのコンポーネントをフル稼働させたらこれをオーバーするのだが、それを液冷でなんとか動かすのではなく、超えないようにすることで過度の温度上昇を防ぐのは3D Vキャッシュの場合と同じだと思われる
あくまでも上限のパワーは決まっており、この枠の中でワークロードに応じて電力枠を配分する仕組みが入っているというわけだ。サーバー向けだからといって、むやみに電力枠を増やしても性能電力比が悪化するだけであり、このあたりはAMDらしい実装という気がする。
3D構造のチップレットを利用したGPUという観点で言えばインテルのPonte Vecchioが先行しているわけであるが、AMDの実装は過去の同社の実装(3D VキャッシュやInstinct MI250Xなど)の延長にあることが改めて確認できた格好である。
そして、CPUとGPUのユニファイド構成という観点で言えば今のところInstinct MI300Aが唯一であり他社製品にはない。NVIDIAのGH100/200やBH100/200は単に同じパッケージにCPUとGPUが載っているだけで、メモリーはそれぞれ別々になっており、メモリー同士のインターコネクトも存在しない。インテルはFalcon Shore待ちである。
しかもそれを最小限のコストで実装している(まさかIODが共通とは思わなかった)ことを改めて確認できた発表であった。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ


