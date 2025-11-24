ロードマップでわかる！当世プロセッサー事情 第851回
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる？ CoWoS-L採用の詳細も判明 AMD GPUロードマップ
2025年11月24日 12時00分更新
前回はCPUのロードマップを説明したので、今週はGPUである。といってもコンシューマー向けのRDNAについては連載850回のロードマップにあるように、なにも示されていないに等しいので、説明できるのはInstinctシリーズのロードマップである。
CoWoS-SからCoWoS-Lに切り替わったMI400シリーズ
サーバー向けロードマップは連載829回で説明しているが、そのときからのアップデートは「MI400シリーズの詳細がもう少し明らかになった」「MI500シリーズがロードマップに出現した」というあたりである。
MI500の話は後で触れるとして、まずMI400シリーズについて。MI300世代はSIoD(Server I/O Die)の上にCCDやGCDなどを3D実装したうえで、そのSIoD同士をインターポーザーで接続するという構成で、その際にシリコン・インターポーザー(CoWoS-S)を利用していたのが、MI400ではCoWoS-Lに切り替わることが明らかにされた。
CoWoS-Lはローカル・シリコン・インターコネクト＋RDLインターポーザーという構成になっており、いわばインテルのEMIBとほぼ同じものである。
この手の実装で言えば、連載644回で説明したInstinct MI250シリーズのElevated Fanout Bridge 2.5Dがあるのだが、こちらはOSAT(おそらくASEのもの)の協力の元での実装であり、今回はTSMCのソリューションを使った、という点が異なるものだ。
なぜElevated Fanout Bridge 2.5Dを使わなかったのか、もしくは、CoWoS-LがElevated Fanout Bridge 2.5Dより優れているのはどのポイントなのかは残念ながらスライドからは見えてこないので、そのうち機会があればAMDに聞きたいところだ。
MI450の演算性能はMI355Xの倍
そんなMI400シリーズだが、すでにMI450とMI430という2種類の製品があることが判明している。まずMI450であるが、FP4で40PFLOPSという性能と、HBM4で容量432GB、帯域19.6TB/秒という数字が出ている。
連載829回でMI350XとMI355Xの性能を示したので、ここから抜き出して比較すると以下のようになる。
|MI350XとMI355Xの性能比較
|MI350X
|MI355X
|MI450
|FP4性能
|18.5PF
|20PF
|40PF
|FP8性能
|9.2PF
|10PF
|20PF
|メモリー容量
|288GB
|288GB
|432GB
|メモリー帯域
|8.0TB/秒
|8.0TB/秒
|19.6TB/秒
|スケールアップ帯域
|1075.2GB/秒
|1075.2GB/秒
|3600GB/秒
|スケールアウト帯域
|128GB/秒
|128GB/秒
|300GB/秒
演算性能はMI355Xの倍になっており、メモリー容量はMI350X/355Xの36GB(3GB/ダイの12 Hi Stack×8)から432GBに増強され、帯域は19.6TB/秒になった。この数値は、連載830回で紹介した内容と同じであり、この時にはMI400として紹介されたのが今回はMI450とされた、というあたりだろう。
それゆえ、このときのHBM4の構成は12スタックだろうというという推定は現在も有効である。ただ速度の方は計算が間違っていた。転送速度は1万9600GB/秒×8bit÷2048bit÷12≒6380Mbpsで、6.4Gbpsでの転送になるものと思われる。
スケールアップ/スケールアウトの帯域であるが、例えばInstinct MI355Xの場合、ボード内で相互接続するインフィニティ・ファブリックは7リンク@153.6GB/秒、外部に接続するPCIe 5.0 x16が128GB/秒(双方向での合計帯域)となっている。キャリアボードには8枚のInstinct MI355Xが搭載されるので、ある1枚が他の7枚に通信する帯域の合計は153.6×7＝1075.2GB/秒というわけだ。
Hot Chips 2025におけるAMDの"4th Gen AMD CDNA Generative AI Architecture Powering AMD Instinct MI350 Series GPUs and Platforms"という講演より抜粋
信号速度的に言えば、片方向あたり64bit@9.6Gbps、96bit@6.4Gbps、128bit@4.8Gbpsのいずれかかと思われる。信号速度とバス幅のバランスがいいのは96bit@6.4Gbpsかと思うが、ではMI450はどうか？ というのが次の問題。帯域が3倍強になっているのはすさまじいのだが、それがどういう構成になっているのか、が次の問題である。
少なくともMI350シリーズまでの相互接続でこの帯域を実現しようとすると、インフィニティ・ファブリックのリンク1本あたり500GB/秒を超えることになる。どう見てもこれは非現実的である。
