このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第879回

なぜAIには「光」が必要なのか? NVIDIAが解説するスケールアップネットワークの低遅延・省電力化戦略

2026年06月08日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

ミリ秒の遅延も許されない学習・推論
ボトルネックとなるFEC(誤り訂正)の壁

 ではなぜ複数枚/ラックの規模ではスケールアップ・ネットワークが必要なのか? というのがここからの説明。まずトレーニングの場合では、複数のGPUに分散させる形で学習に必要となる計算をさせるわけだが、層ごとに結果の集計(All Reduce)の処理が入る。

正確に言えば集計ではないのだが、雰囲気としては伝わるだろう

 ということは複数のGPUを同期させて結果を集める必要があるわけだが、この同期をどうやって取るかといえば当然ネットワーク経由である。したがって、ここのレイテンシーが大きいと同期をとり終わるまでの待ち時間が長くなる。

 このAll Reduceの頻度が少なければそれほど問題はないのだが、実際はかなりの回数が実施されるわけで、塵も積もれば山となる。一方推論は? というのが下の画像だ。

ここにもあるが、トークンあたり数千層の処理があり、そのトークンがユーザーごとに数千個生成されると、合計で数百万~数千万層の処理が行なわれる計算になる。当然レイテンシーはこの数との乗算になるため性能に直結するわけだ

 連載871回スライドに話が戻るのだが、プリフィルに関しては1回通るだけである。ところがデコードに関してはトークンが来るたびにこれが何度でもぐるぐる回ることになる。

連載871回のスライド

 1枚のGPUの中でこれが回っているのなら別に問題はないが、問題は処理ごとに、場合によっては異なるラックに設置された異なるGPUに処理結果を送って次の処理が行なわれる、というケースもあり得るわけで、こうなるとレイテンシーが猛烈に性能に効いてくることになる。これが従来のネットワークのままでは厳しいということでスケールアップ・ネットワークとして新たに注目を集めている理由である。

 さてではどうやってスケールアップ・ネットワークを構築するか? 下の画像は「現在の」光イーサネットをベースにした場合のレイテンシーを細かく分析したものである。

"Scale upのBreakdown"とは書かれているが、実質的にはScale outのBreakdownである。で、赤字が問題になる部分である

 この中でどうにもならないのが、媒体(つまり光ファイバー)を信号が通る時間で、ラフに言って5ns/mほどになる。これも最近はHCF(Hollow core fiber:中空コアファイバー)が出てきて、従来より3割ほど高速(ガラスやプラスチックより空気の方が伝達速度が速い)になるという話なので、これを使うと3.5ns/mほどになるが、それは媒体の話なので置いておく。

 まずPHY層で言うとSerDes(信号の変換)+DSPによる処理+AFE(Analog Front End:電気的な信号の増幅)で50ns、FEC(Forward Error Correction)で50~100ns、データリンク層での暗号化を施すとそこで0~50ns、そしてスイッチ内部で100~200nsのレイテンシーがそれぞれ必要になる。

 つまりそのほかの要因を一切考えず、ケーブルが2mだとしても320~620nsのレイテンシーが発生する。これはGPU同士の同期をとるためのレイテンシーとしてはかなり厳しい数値である。

 ではこれをどうするか? まず簡単にできる案としては、Fat-TreeにしてもLeaf-Spineにしても、複数のスイッチをネストさせる形で接続するため、Fat-Treeにおけるエッジ、あるいはLeaf-Spineにおけるリーフレベルで通信ができればいい。

 しかし、コアだのスパインだのまでパケットが迂回すると、それだけでレイテンシーが爆増する(1段増えるだけで2回スイッチを経由するため、それだけで200~400nsのレイテンシー増になる)。そこでスイッチは1段だけで済むようにスイッチのポートを増やす必要がある。

 またNVIDIAで言えば従来は1本のラックに72枚のGPUカードだったので、これに向けて構成を最適化する(より大規模な構成は考えない)などがアーキテクチャーや構成レベルで可能なことである。そしてその下のレイヤーでいえば、もうとにかくPHYとMACの最適化でしかない。

 ここで槍玉に挙がるのがFECである。例えばイーサネットの場合、50Gbps以上のもので広く利用されているのがRS FEC(544,514)である。これはReed-Solomon Forward Error Correctionと呼ばれるもので、514bitの送信データを544bitのシンボルに変換して伝送する仕組みで、1つのシンボルに対して最大15のエラーを訂正可能な強力なものである。

 実際100Gイーサネットや200Gイーサネットでは、このFECがないとBERが10-6オーダーなのに、FECを併用することで10-12オーダーまでエラーを減らせる。ただし副作用もあり、これを利用するためにはDSPをブン回して計算する必要があり、これだけで100ns程度のレイテンシーが追加される。

 DSPはこれ以外にもいろいろな処理をしている。例えばデジタルフィルターを使ったDFE:Decision Feedback EqualizationもDSPで処理されることが普通である。したがって、このDSPの消費電力の多さとレイテンシーの大きさはいかんともしがたい。

 ただFECに関しては、FLIT(Flow Control Unit)という新しい再送メカニズムを併用することで負荷を減らせることはすでにPCI Express 6.0の世代で実証済である。これは軽量なFEC(例えば25GイーサネットのRS-FEC(528,514)のように、計算負荷が低いもの)を前提にしたものだ。軽量なFECでは、完全にはエラーを訂正しきれない。そこでエラーがあったときは再送することでカバーするという発想だ。

 再送すると100ns程度のレイテンシーが追加されるので従来のFECと変わらないが、常時100nsのレイテンシーが必要な従来のFECと比べると、ほとんどは数十ns(RS-FECの選択次第では10ns台)のレイテンシーで済み、たまに100nsになるのと、トータルでどちらがレイテンシーが少ないかという選択である。

もうこのあたりから、イーサネットなどの既存の規格との互換性を捨てて、なりふり構わずレイテンシーを削減しないといけないという決意が読み取れる

 また、そもそもFECやDFEがなぜ必要か? といえば信号速度が高くてSN比が悪化しているからで、信号速度を落とせば強力なFECやDFEがなくてもエラー訂正の必要性が下がるため軽量なFEC/DFEで済み、それだけレイテンシーが下がるメリットがある。

 あとCPOに代表される構造は、電気信号の配線を最小化できるのでAFEの必要性を最小限にしてくれるし、そのCPOをASICとシリコン・インターポーザー経由での配線にできれば、この配線によるレイテンシーも最小化できることになる。

 ただし、信号速度を落としたらそれだけスループットも減ってしまう。これをどう補うか? というのがWDM(Wavelength Division Multiplexing:波長分割多重)である。これは、1本の光ファイバーに多数の光信号を同時に通せば、信号あたりの速度が遅くてもトータルでのスループットが稼げるという話である。

 WDMにはCWDM(Coarse WDM)とDWDM(Dense WDM)があり、要するにその光の波長をどのくらい変えるかという間隔である。CWDMの場合、1310nm帯の場合では1270nm~1610nm程度の範囲を20nm間隔で最大18波長ほど多重化する。

 一方DWDMの場合、現時点では1530~1565nmあたりの波長を利用するが、その際に0.4nmあるいは0.8nmという非常に波長差の少ない光信号を利用する形になる。このあたりはどのくらいの距離をどんな光ファイバーを使うか、トータルとしてどの程度の帯域が必要なのかで利用する波長が決まってきた経緯があるのだが、Nedovic博士的には、もう互換性をどうせ考えないのなら帯域を引き上げやすい(=多重化する波長を増やしやすい)DWDMに魅力を感じているようだ。

波長を増やす(=信号速度を落とす)もう1つのメリットはPAM4などの複雑な変調を使う必要もないことである。また従来DWDMは長距離向けということで高出力のレーザーが必要だったが、スケールアップ・ネットワークではそれこそシリコン・フォトニクスベースのレーザーでも十分な出力が得られるから、コンポーネントの数を減らせる&小型化できるのもメリットとしている

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
1
Apple 2026 MacBook Air M5チップ搭載13インチノートブック:AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、日本語キーボード、Touch ID - スカイブルー
Apple 2026 MacBook Air M5チップ搭載13インチノートブック:AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、日本語キーボード、Touch ID - スカイブルー
¥176,566
2
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
¥35,129
3
【整備済み品】ノートパソコン 東芝 Dynabook G83 13.3インチ FHD 軽量 Webカメラ 第11世代 Corei5-1135G7/Windows 11 Pro/MS Office 2021搭載/初期設定不要/Wifi 6/Bluetooth/HDMI/Type C/LANポート/SDカードスロット/有線静音マウス付属(メモリ8GB,SSD256GB)
【整備済み品】ノートパソコン 東芝 Dynabook G83 13.3インチ FHD 軽量 Webカメラ 第11世代 Corei5-1135G7/Windows 11 Pro/MS Office 2021搭載/初期設定不要/Wifi 6/Bluetooth/HDMI/Type C/LANポート/SDカードスロット/有線静音マウス付属(メモリ8GB,SSD256GB)
¥33,048
4
【整備済み品】富士通 LIFEBOOK U939 13.3型 フルHD モバイルノートPC Core i5-8265U メモリ8GB SSD256GB Windows11 Office2019搭載 1920×1080 無線LAN対応 カメラ搭載 初期設定済み 軽量薄型 ビジネス 学習 在宅ワーク
【整備済み品】富士通 LIFEBOOK U939 13.3型 フルHD モバイルノートPC Core i5-8265U メモリ8GB SSD256GB Windows11 Office2019搭載 1920×1080 無線LAN対応 カメラ搭載 初期設定済み 軽量薄型 ビジネス 学習 在宅ワーク
¥26,180
5
ESBOOKノートパソコン 【MS Office 2024搭載&Windows 11 Pro】14インチIPS液晶/1920×1080FHDディスプレイ カメラ付き/薄型PCノート高性能CPU/初期設定不要/8Gメモリ/無線LAN/大容量SSD/初心者向け・パソコンノート/日本語キーボードフィルム付き/ワイヤレスマウス付き(256G SSD, ローズゴールド)
ESBOOKノートパソコン 【MS Office 2024搭載&Windows 11 Pro】14インチIPS液晶/1920×1080FHDディスプレイ カメラ付き/薄型PCノート高性能CPU/初期設定不要/8Gメモリ/無線LAN/大容量SSD/初心者向け・パソコンノート/日本語キーボードフィルム付き/ワイヤレスマウス付き(256G SSD, ローズゴールド)
¥38,999

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
¥2,680
2
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
¥1,890
3
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ホワイト T-K6A-2630WH
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ホワイト T-K6A-2630WH
¥1,690
4
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
¥990
5
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥740
6
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GW
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GW
¥1,680
7
エレコム USB Type C ケーブル 1m 100W PD対応 高速充電 シリコン素材 なめらか やわらか 【 MacBook/iPad/Galaxy/Android スマホ タブレット 等対応 】 ブラック 【iPhone 16 シリーズ 対応検証済】 MPA-CCECSS10BK
エレコム USB Type C ケーブル 1m 100W PD対応 高速充電 シリコン素材 なめらか やわらか 【 MacBook/iPad/Galaxy/Android スマホ タブレット 等対応 】 ブラック 【iPhone 16 シリーズ 対応検証済】 MPA-CCECSS10BK
¥980
8
NIMASO ガラスフィルム iPad 第11世代(A16) 2025用/iPad 10.9インチ 第10世代 2022用 衝撃吸収 強化 ガラス 保護フィルム 指紋防止 ガイド枠付き NTB22I574
NIMASO ガラスフィルム iPad 第11世代(A16) 2025用/iPad 10.9インチ 第10世代 2022用 衝撃吸収 強化 ガラス 保護フィルム 指紋防止 ガイド枠付き NTB22I574
¥1,519
9
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
¥5,645
10
【Amazon.co.jp限定】バッファロー 外付けハードディスク 4TB テレビ録画/PC/PS4/4K対応 バッファロー製nasne™対応 静音&コンパクト 日本製 故障予測 みまもり合図 HD-AD4U3
【Amazon.co.jp限定】バッファロー 外付けハードディスク 4TB テレビ録画/PC/PS4/4K対応 バッファロー製nasne™対応 静音&コンパクト 日本製 故障予測 みまもり合図 HD-AD4U3
¥17,980

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン