GTC 2026激震！突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰

2026年04月13日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

演算のRubin、帯域のGroq
NVIDIAが踏み切った「CUDA非対応チップ」採用の背信と確執

　以上のことから、GTCで発表されたのが推論アクセラレーターのGroq 3 LPUである。Groq社本体はもうチップやシステム販売ではなくクラウドサービスの形でのビジネスを行なっているので、このGroq 3は(製造こそGroqなものの)事実上NVIDIAに対する専売品という扱いと考えていいだろう。

Groq 3はCUDAが動かないので、ここはFFNの実装はGroqのフレームワークを利用することになる。そう考えると、実はNVIDIAが提供する構成とネットワークでしか当初は使えない。この不便さを踏まえても、Groqを利用すべき理由があった

　詳細は明らかにされていないが、ここにあるように演算性能こそFP8で1.2PFlopsでNVFP4で50PFlopsのRubinに遠くおよばないが、500MBのSRAMを搭載することで150TB/秒と22TB/秒でしかないRubinを大幅に超えるメモリー帯域を誇っており、演算能力よりもメモリー帯域が重要なDecodeの、特にFFN向けには非常に効果的に利用できるわけだ。実際にはこのGroq 3 LPUが8つ、1Uシャーシに収まる形で提供される形になる。

Groq 3 LPXはこのシャーシを32枚ラックに収めた構成になる。LPU C2C LinkはGroq独自のもの。BlueField 4が搭載されており、Vera Rubinとはこちら経由で接続されることになると思われる。Hostは不明だが、DIMMスロットが4つのあたり、Granite Rapids-DベースのXeon 6なのかもしれない

ロードマップから消されたRubin CPX
TSMC供給問題とGDDR7高騰が阻んだ量産化

　NVIDIAはGroq 3 LPXに先立ち、2025年9月にRubin CPXを発表している。その翌月に開催されたGTC 2025 Washington, D.C.の基調講演で示されたロードマップが下の画像だ。

GTC 2025の基調講演で示されたロードマップ。RubinとRubin Ultraの間にRubin CPXがある。"CUDA Everywhere"が印象的

　そしてその半年後である今回のロードマップが下の画像である。Rubin CPXがなかったことになっているのがわかる。

2026年のロードマップ。Rubin CPXがなくなっているし、"CUDA everywhere"も行方不明

　公式にはNVIDIAはRubin CPXのキャンセルについてなにも述べていないが、理由はいくつか思いつく。

(1) Rubin CPXはRubin/Rubin Ultra同様TSMCの3nmで製造されるが、そのTSMCの3nmは逼迫しており、低価格向けのRubin CPXを量産できるほどのゆとりがない。Groq 3 LPUはSamsungの4nmでの製造と伝えられており、TSMCの供給を圧迫しない。

(2) 低コスト向けということでHBMではなくGDDR7を接続する方式だったが、昨今のメモリー高騰のためにGDDR7にしても全然安くならない

(3) Rubin CPXは本質的にRubinと変わらないから、FFN向けに適しているわけではない。Groqは推論専用に特化しており、また決定論的データフロー(動的につなぎ方を変えるのではなく、最初にどう接続するかを決めておく)を採用しているため、LatencyがRubin CPXより低くスループットも稼ぎやすい。

　最大の欠点はCUDA未サポートもそうだが、データ型が合ってない(FP8まででRubinのNVFP4には未対応)ことで、それもあってロードマップをみるとGroq 3にNVFP4のサポートを追加したLP3Sなるチップがこの後出てくるらしい。

　自社のソリューションにCUDA未対応のハードウェアを混ぜてまででも性能を確保する必要があったというか、Rubin CPXが予想外の困難に直面して他に方法がなかったという話なのかもしれないが、NVIDIAとしては大きな決定変更をしたことになる。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ