ロードマップでわかる!当世プロセッサー事情 第851回
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ
2025年11月24日 12時00分更新
MI450のライバルはNVIDIAのVera Rubin
MI450を搭載したHeliosを、NVIDIAの次期GPUであるVera RubinベースのNVL144と比較したのが下の画像だ。MI350XはNVIDIAのBlackwell、MI355XはBlackwell Ultra対抗であり、MI450はRubin対抗という位置づけになっていることがよくわかる。
このMI450、10月6日にはOpenAIとの6GW分のシステム契約を発表しており、最初の1GW分がこのMI450ベースのシステムになる。残りは状況に応じてMI450ないしMI500になるのだろう。そのほか、10月14日にはOracleにMI450ベースのシステムを5万枚納入する発表があるなど、初速もそれなりに順調である。ところで、これと同じ時期に以下の大きな発表を2つ行なっているのだが、ここに採用されているのはMI430Xだとしている。
- 10月27日、DiscoveryとLuxという2つのスーパーコンピューターをオークリッジ国立研究所に納入する契約をDOE(米エネルギー省)との間で締結
- 11月18日、Alice Recoqueというスーパーコンピューターをフランスに納入する契約を発表
このMI430Xは「ソブリンAIおよびHPC向け」という位置づけで、MI455Xとなにが異なるのか、下の画像ではよくわからない。
ただ注目すべきは"Hardware-Based FP64"という文言である。以前連載829回でも触れたが、MI350世代はMI300世代と比較してFP64の性能が半減している。MI300Xの性能一覧表を見ていただくとわかるが、MI300XはVector FP64で81.7TFLOPS、Matrix FP64で163.4TFLOPSなのに、MI355XはVector FP64で78.6TFLOPS、Matrix FP64でも78.6TFLOPSでしかない。
VectorはともかくMatrixでの性能低下が著しいわけで、HPC向けの用途であればMI355Xを使うよりMI300Xの方が性能が出るという状況だった。AMDから明確な説明はないが、Vectorはそもそも性能を強化していないので動作周波数に比例して性能が下がる一方、Matrixは新データ型のサポート(FP6/FP4)にあわせてFP64のエンジンを半減させて、エリア効率を高めたのだろう。
しかし、MI430XはHPC、つまり科学技術計算およびソブリンAI向けということで、FP64のニーズが高い。これに向けて、MI455Xと異なる構成になっているのではないかと筆者は予測している。つまりMI455XとMI430Xでは、SIoDは同じだが、その上に載るGCDが例えばGCD-AIとGCD-HPCの2種類が用意されており、GCD-AIはMI350の路線を汲むAI特化型(なので、FP64のサポートはバッサリ落とされている可能性すらある)、GCD-HPCはFP64のサポートを強化したマルチロール型(なのでピークのAI性能はGCD-AIにおよばない)という感じになっているのではないか、と想像している。
もう一つ別の案としては、GCDとは別にFP64専用のアクセラレーターダイ(FCD:FP64 Compute Die)が別に用意されているというものだ。この場合MI455XはGCDのみだがMI430XはGCD+FCDのコンビネーションという可能性も技術的には可能だろうが、実現可能性は低いように思われる。このあたりは、来年以降になにかしら公開されるかもしれない(今年中は望みが薄いだろう)。
最後がMI500シリーズの話だが、こちらはMI450にもまして大幅な性能向上がある、としている。
ただそろそろデータ型の節約による性能強化は頭打ちなので、演算器の数を強化するくらいしか方法はない。まさかFP2というわけにもいかないし、そのくらいならInt 1/Int 2を使ってバイナリーネットワーク専用にした方がいっそ潔い。
だが、どんな方法でこれを実現するつもりなのかは現時点では不明だ。このMI500はNVIDIAで言えばRubin Ultraと競合する形だが、Rubin Ultraは4ダイ構成(RubinはBlackwell同様2ダイ)でRubinの倍の性能という話になっている。さてMI500はどうするのだろうか?

この連載の記事
-
第853回
PC
7つのカメラと高度な6DOF・Depthセンサー搭載、Meta Orionが切り開く没入感抜群の新ARスマートグラス技術 -
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? - この連載の一覧へ














