ロードマップでわかる!当世プロセッサー事情 第879回
なぜAIには「光」が必要なのか? NVIDIAが解説するスケールアップネットワークの低遅延・省電力化戦略
2026年06月08日 12時00分更新
前回予告したように、今回もコネクティビティについてだ。ISSCC 2026でNVIDIAのNikola Nedovic博士(Sr.Research Scientist)が発表した"Emerging Low-Latency Optical Connectivity"の内容を解説したい。
なぜAIに新たなネットワークが必要なのか?
フロントエンドとバックエンドの分離
そもそも光接続を利用するニーズはなにか? として博士が指摘するのはまず消費電力。PUE(Power Usage Effectiveness:IT関連施設におけるエネルギー効率を測定する指標)は2023年の段階で1.58程度になっているが、もうこれ以上下がらない(むしろ上がっている)のがわかる。
加えて全体の消費電力も上がる傾向にあるのは言うまでもない。さらにIT機器そのものの電力も上がりつつある。例えば1Pbpsの転送速度が求められる時代に、転送効率が5pJ/bitだとするとその転送だけで5kWの消費電力になる。
転送効率が5pJ/bitだとすると転送だけで5kWの消費電力になる。前回のグラフを見てもらっても、5pJ/bitの達成すら難しいことがわかるだろう
実はこの消費電力問題、もうそんなに先の話ではない。というのは以前のアナウンスでは今年後半に登場するKyberラックベースのRubin Ultra NVL576ではNVLinkが1.5PB/秒(=12Pbps)、CX9(つまりイーサネット)が115.2TB/秒(=921.6Tbps)になる予定だった(NVL576そのものの構成が変わったため現在はこの数字にはならない)からで、仮に1pJ/bitまで下げてもNVLinkが12KW、イーサネットが1KWを喰う計算になる。
これをなんとかしようと思った場合、特に帯域が増えるとどうしても銅配線を利用する電気信号では消費電力が爆増する(あと距離が伸びた場合も同じく)ということで光配線しかない、という話になる。講演ではこの後光接続を利用した場合の帯域や特性、BERの検討などが論じられているが、これは新しい話ではないのでここでは割愛する。要するに光接続はすでにコストを含めて有望な選択肢になっている、という話だ。
ではデータセンターの現場はどうなっているのか? というのが下の画像だ。AI FactoryというのはNVIDIAの造語であって一般的な用語ではないと思うが、AIデータセンターは従来型のクラウド用データセンターと比べてプロセッサーの数が5倍、消費電力は20倍近くに跳ね上がる。
問題はその100Kなり512Kなりのプロセッサーをどうつなぐかである。下の画像はやや古いネットワーク構成であって、コア-アグリゲーション-エッジという3層のスイッチを経てその下にCPU(サーバー)がぶら下がるFat-Tree構成である。
これ以外のものとしては、例えばHPのDragonFlyや、京あるいは富岳で採用されたtofu interconnect(6次元メッシュ/トラス)構成などがあるが、これは例外的である。最近ではこれがLeaf-Spine構成になっているわけだが、ただFat-Treeの2次元的な接続をLeaf-Spineの3次元的な構成に変えたからといって劇的に性能が変わるわけではない。
こうした従来型のネットワークの場合、レイテンシーが大きくなると性能が急速に低下するケースが多い(アプリケーション次第)というのは以前から知られていた話である。
左図は主要なアクセス手段とそのレイテンシーをまとめたもの。右はレイテンシーが大きくなると性能がどう低下するかを示したもの。TPCCのMySQLのように、最初からレイテンシーが大きいことを盛り込んだアプリケーションなら性能低下が抑えられる。問題はなんでもこうした対処が可能ではないことだ
これがAIデータセンターではどうなっているのか? というのが下の画像である。従来型のネットワークによる接続(Front End)とは別に、GPUというかアクセラレーター同士を接続するネットワーク(Back End)を用意することになっている。
レイテンシーが大きくても構わない接続はFront Endを、レイテンシーを低く抑えたい接続にはBack Endを使おう、というわけだ。このFront Endをスケールアウト、Back EndをスケールアップとNVIDIAでは定義している。
この2つをどう使い分けるか、の説明が左下のWorkload mappingに示されている。要するに大規模なLLMなどでは、1枚どころか1本のラックですら足りないくらいに規模が大きくなっており、こうした用途で必要としている。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第878回
PC
もはや銅配線は限界? 3200Gイーサネット実現に立ちはだかる200GT/秒の壁 -
第877回
PC
「不良品ゼロ」と「水冷NG」の狭間で。ルネサスが明かした車載チップレットSoCのリアル -
第876回
PC
このままではメモリーが燃える! HBM4/5世代に向けた電力供給の限界と、Samsungが示すパッケージ協調設計の解 -
第875回
PC
1000A超のAIプロセッサーをどう動かすか? Googleが実践する垂直給電(VPD)の最前線 -
第874回
PC
AIの未来は「電力」で決まる? 巨大GPUを支える裏面給電とパッケージ革命 -
第873回
PC
「銅配線はまだ重要か? 答えはYesだ」 NVIDIA CEOジェンスンが語った2028年ロードマップとNVLink 8の衝撃 -
第872回
PC
NVIDIAのRubin UltraとKyber Rackの深層 プロトタイプから露見した設計刷新とNVLinkの物理的限界 -
第871回
PC
GTC 2026激震! 突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰 -
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 - この連載の一覧へ

















