ロードマップでわかる!当世プロセッサー事情 第843回
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する?
2025年09月29日 12時00分更新
消費電力はGB10全体で140W
動作周波数をB200の3分の1くらいに落とさないと不可能な数字
下の画像がGB10そのもののスペックである。まずGPU Dieletであるが、写真で言えば上側にあたる部分だ。動作周波数などは不明だが、AI向けがFP4で1000TOPS(1peta OPS)であり、FP32を使ったCUDAの場合で31TFlopsとされる。
HDMI以外にDisplayPort×3が追加されている。DGX Base OSというのはUbuntuの上にNVIDIAがDGX用のソフトを載せたもので、最新はUbuntu 24.04をベースにしたDGX OS 7となる
まずAIの方で見ると、この1peta OPSというのは、GB200 NVL72に搭載されるB200のちょうど20分の1の計算になる。記事冒頭の画像で示されるように、B200はGPCあたり20個のTPCを搭載、TPCあたりのSMが2つである。そのGPCがダイあたり4つなのでダイあたり80TPC、160SM。2ダイで160TPC、320SMという計算になる。
SMあたりのCUDAコアは128なので、40960 CUDAコアという計算だ(冗長ブロックは勘定に入れずに、理論上の個数を計算している)。一方、上の画像を見ると、TPCがトータルで24個あるように見える。したがって数だけ計算すると24:160≒1:6.67ということで、TPCの個数とはマッチしないのだが、おそらくそれだけ動作周波数が落とされているものと考えられる。
NVL72に搭載されるB200はTDPが最大1200Wという代物で、とうていDGX Spark Workstationの筐体では冷却能力が不足している。後述するが消費電力はGB10全体で140Wと説明されており、CPUも相応に電力を喰うし、メモリーコントローラーその他もあることを考えると、GPUが消費可能な電力は良くて100W程度だろう。これに収めようとすると、動作周波数をB200の3分の1くらいに落とさないと辻褄が合わない。
B200は2ダイで1200Wなので1ダイで600W。動作周波数を3分の1にすれば、消費電力が100Wくらいまで落ちることそのものは不思議ではない。加えて言えば、製造プロセスはGB200などのTSMC 4NからTSMC N3に変更になっている。この分も多少は省電力化に貢献しているかもしれない。
CPUもやや珍しい構成である。20コアだが片方はCortex-A925×10、もう片方がCortex-A725×10となっている。高効率なCortex-A520ではなく、バランス型であるミドルレンジのCortex-A725を選んでいるというあたりで所謂big.LITTLE的な狙いでないことは明らかだし、クラスターごとに独立した3次キャッシュを16MB搭載するというのも使い方として珍しい。
おそらくCortex-A925のクラスターがBlackwellとのデータのやり取りや実行制御、Cortex-A725のクラスターがOSやその他のI/Fとの制御などを担当するのではないかと思われる。2つのクラスターがそれぞれ独自に16MBの3次キャッシュを持っているということは、10コアずつ別々にDynamIQのクラスターが搭載され、間がCache CoherentなSystem Fabricでつながる構造になっているはずだ。
興味深いのは、System FabricがCHI-Eをサポートしており、またCPUとGPUの間はNVLink C2C I/Fで接続されていることである。なので、実質的には連載838回で紹介したNVLink Fusionをサポートすることが可能ではないかと思われることだ(まだGB10発表時点ではNVLink Fusionの発表が行われていなかったのと、NVLink Fusionの外部への公式の実装はRubin世代になると思われていたから、BlackwellベースのGB10は微妙にこの条件から外れることになる)。
もっともNVLink FusionはこのGB10をベースに開発されたのではないか? と思う節もある。C2C周りはNVIDIAの独自IPとはされているものの、実際にはUCIeのIPの上にNVIDIAのNVLink用のプロトコル層を載せたのではないか? と考えるからだ。
LPDDR5は256b幅で128GBとあるから、あるいは2024年7月にSamsungが発表した16GBのLPDDR5xあたりが使われている可能性が高い。おのおの32bit幅で8個搭載すると256bit幅・128GBとなる。
上の画像では、最大4枚のディスプレーが接続できることのほかにSoC TDPが140W(*)であることが示されている。CPUとGPUはどちらもインターポーザー(おそらくらくシリコンでCoWoSを利用している)に搭載されているのがわかる。
(*):NVIDIAの仕様ページではPower Consumptionが"TBD(To Be Determined:後で発表)"になっている。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ












