このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第829回

2026年にInstinct MI400シリーズを投入し、サーバー向けGPUのシェア拡大を狙うAMD AMD GPUロードマップ

2025年06月23日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

MI350シリーズには空冷のMI350Xと液冷のMI355Xがある

 ここまではMI300Xとの比較だが、ではNVIDIA B200およびGB200とでは? ということで素の性能比較が下の画像だ。

ピーク性能はほぼ同等なわけで、あとはメモリー量の大きさが実効性能にどこまで効いてくるかである

 LLMの推論実行スループットは同等~1.3倍。またLlama 3では同等だがLlama 2では最適化を進めることでB200/GB200比で10%程度高速で動作するとしている。

LLMの推論実行スループット。これはFP4同士での比較である

Llama 2/3なのでFP8ないしBF16での比較となっている

 実際にはMI355Xは単体のOAMでの提供ではなく、8枚をまとめたUBB8というキャリアボードに実装する形での提供が一般的なようだが、これには空冷と液冷の2つの構成が用意される。

これは8枚のMI355Xのトータルでの性能

横から見ると、空冷の方はヒートシンクがかなりの高さがあるので高密度実装ができない。そういう用途には液冷の方が向いているが、メンテナンス性は空冷の方が良いわけで、ターゲットの性能やコストなどとの勘案になるだろう

 MI350シリーズはMI350XとMI355Xの2製品があり、液冷はMI355X、空冷はMI350Xになるようだ。下の画像はホワイトペーパーから抜粋した両製品の仕様であるが、SP数やMatrixコア数、メモリー構成などは完全に一緒で、ただしMI350Xが2.2GHz駆動で消費電力が1000W、対してMI355Xは2.4GHz駆動で消費電力が1400Wとなっている。

やや縦長で見にくいが、2.4GHz→2.2GHzに動作周波数が落ちたことで、ピーク性能もこれに比例して落ちているが、差はこれだけである。この程度の性能差で400W消費電力が減るならMI350Xの方が良さそうな気もするのだが、これは実際の性能と消費電力を持ってこないと判断が難しい

 駆動動作周波数200MHzが最大400Wの消費電力の差につながるというのは性能/消費電力比ではあまりよろしくない気もするが、1000Wなり1400Wなりはあくまでも最大消費電力であり、実際の実効性能がどの程度なのか具体的なデータが欲しいところではある。

 ちなみに性能/コストに関しては下の画像も出ているのだが、これは消費電力ではなくボードの定価ベースでの計算と思われる。

性能の方はLlama 3.1-405BをFP4で比較したもの。価格の方はクラウドプロバイダーによるB200 InstanceとMI355X Instanceの料金ベースだそうだ

 AMDはまたこのMI350Xシリーズで、Rack Scale Solutionの提供も開始することを公開した。NVIDIAで言えばGB200 NVL72に相当するようなものと考えればいいだろう。

2Uサーバーでは128 GPU(UBB×16)、3Uサーバーでは96 GPU(UBB×12)の模様だ

空冷なのでUBBを搭載するシャーシは6Uとなる分、台数は少ない

 ただNVIDIAと異なり、AMDがこれをセットで提供するわけではなく、OEMないしODMパートナーから提供される形となっている。どちらのソリューションもラックの構造はOCPで定められたものに準拠した標準品であるとしている。

 ちなみに今回、OracleがこのRack Scale Solution(規模から言って、おそらく液冷の方だろう)を利用して、MI355Xを13万1072個集積するOCI(Oracle Cloud Infrastructure) クラスターを構築することも発表している。ラック数1024本の、なかなか壮大なシステムになることが予想される。この際にラックの間をどうつなぐのかは今回のリリースでは明らかになっていない。

 すでにAMDはUALink(Ultra Accelerated Link)をサポートすることを明らかにはしているが、現状ではまだUALinkに対応したカードやスイッチが存在しない。ただUEC(Ultra Ethernet Consortium)についてはすでに対応したCard(Pensando Pollara 400)が存在している話は連載795回で触れた。

 スイッチの方も、今年3月にArista NetworkがUECに前方互換性を持つEtherlink AI Platformを発表しており、あるいはこれを併用してシステムを構築している可能性がある。このあたりはまた後で触れたい。

カテゴリートップへ

この連載の記事