前回はAdvancing AI 2025全体の話を説明したが、今回はサーバー向けGPUのInstinct MI350XとMI400Xについてもう少し深堀りしていく。
Instinct MI350XのXCDはTSMC N5からN3Pに、IODはTSMC N6のままだが中身は別物
まず2つのチップそのものを比較してみたい。下の画像はパッケージが正方形かつ、同じ外形寸法であるという前提で縮尺を変えて並べたInstinct MI300XとMI350Xの比較である。
Instinct MI300XとMI350Xのチップ。HBM3eの大きさは共通なので縮尺の仮定は間違ってなさそう。それはともかくHBM3eの位置がだいぶ変更されているし、IODのレイアウトもかなり異なっている
連載726回でも触れたが、Instinct MI300XはXCDがTSMC N5、IODがTSMC N6と説明されていた。これに対しInstinct MI350XはXCDがTSMC N3P、IODがTSMC N6となっており、少なくともXCDは完全に作り直しになっているのだが、こうして見比べてみるとIODも完全に別物になっているのがわかる。
| MI300XとMI350Xの構成 | ||||||
|---|---|---|---|---|---|---|
| MI300X | 8×XCD+4×IOD | |||||
| MI350X | 8×XCD+2×IOD | |||||
また展開図もMI300XとMI350ではだいぶ異なっている。下の画像だけで見ると、まるでXCDはすごく大きなダイに見える。
しかし、別のスライドを見ると、XCDを指しているのはダイの4分の1でしかない。つまり、トータルで8つのXCDという構成はMI300Xの時と変わらないことになる。
一方で、ICDの方は2つに減っている。すなわちMI300Xの2倍の大きさになっているわけだが、これはN6の歩留まりの向上などで、大きなサイズのダイを作りやすくなった(歩留まりが落ちにくくなった)ということだろう。
ちなみにMI300Xの世代は、XCDとCCDの両対応にすることでMI300A/C/Xという3種類の派生型を作り出したが、どうもMI350Xの世代はCCDへの対応を省いたように思える(MI350Cに関してはワンチャンあるかもしれないが、MI350Aは完全になさそうだ)。
前回も少し書いたが、MI350XはMI300Xに比べるとAI向けに性能が拡張された一方、HPC向けはFP64 Vectorが同等、FP64 Matrixは半分の性能になっており、しかも動作周波数は微妙に低くなっているから、HPC向けにMI350Xを使うニーズはない(MI300Xを使う方が賢明)ことに起因する。
MI350A的な構成も不可能ではないが、Zen 4→Zen 5での性能向上は期待できる一方でXCDの方はむしろ性能が落ちているわけで、これもMI300Aを使った方が賢そうに思える。
MI350Cは、それが可能かどうか今ひとつはっきりしないのだが、Zen 5ベースのHPC向けプロセッサーが欲しいというニーズが十分にあるなら、CDNA 4のXCDの代わりにZen 5のCCDだけを載せた構成が登場する可能性がないとは言い切れない。
ただMI300Cは未だにマイクロソフトのAzure HPCの推論向けのみにしか公式には提供されておらず、他にも非公開で提供しているところがあるかもしれないが、少なくとも公式に汎用品として提供するほどの数は出ていないようだ。これも正直言えば、MI350の世代では出てこないように思える。次に出てくる可能性があるのはMI400の世代だろう。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ



