800G-ZR+RDMA最適化で「1.6TBを1分強で転送」、3000km離れたAI分散学習の実証実験も
NTTドコビジ、AI/GPUクラスタのDC分散にまた一歩 800Gbps通信で新たな実証に成功
2025年09月01日 08時00分更新
NTTドコモビジネス(NTTドコビジ、旧NTTコミュニケーションズ)は、2025年8月27日、データセンター間のデータ転送を高速化する新たな実証実験の結果を発表した。
今回の実験では、約40km離れたデータセンターにサーバーを分散配置し、データセンター間をつなぐ800Gbps光通信技術とRDMA(Remote Direct Memory Access)技術を組み合わせることで、1.6TBの大容量データをわずか1分余り(68.8秒)で転送することに成功した。遠隔データセンターに分散配置されたGPUリソースの、大規模なAI処理における柔軟な活用、効率性の向上などが期待できるという。
あわせて、3000km離れたデータセンター間でのAI分散学習の実証結果も公表している。こちらでは、単一データセンターで処理する場合とほぼ同等のパフォーマンスが実現できることが確認されている。
AI時代の分散データセンター需要増加と、それを支えるIOWN APN
生成AIの処理には、大量の計算機資源が必要となる。1台のGPUサーバーに搭載できるGPUの数には限りがあるため、複数台のGPUサーバーを束ねて分散処理を行う「GPUクラスタ」の需要が拡大している。
ただし、GPUサーバーなどのGPUインフラを格納するデータセンターにも、給電能力や冷却能力、床荷重といった制限がある。そのため、GPUクラスタが1つのデータセンターに収まらなくなり、やむを得ずデータセンターを分散化するケースが発生しているという。また他方では、事業継続・災害復旧の観点から、GPUインフラのデータセンターをあえて分散化するケースもある。
さらに、経済産業省の「デジタルインフラ(DC等)整備に関する有識者会合」においても、オール光ネットワークを用いて「全国にデータセンターインフラを分散させることを検討すべき」という見解が示されている。
こうした状況の中、NTTドコモビジネスでは、2025年6月にAI時代の次世代ICT基盤である「AI-Centric ICTプラットフォーム」構想を発表した。その要素技術のひとつが、大容量・低遅延・低消費電力を特徴とするオール光ネットワーク「IOWN APN(All-Photonics Network)」である。
同社はこのIOWN APNを用いて、GPUインフラの分散ニーズに選択肢を提供する「GPU over APN」の検証を進めている最中だ。
3000km離れた分散データセンターでも実用的な生成AI学習が可能
GPU over APNは、IOWN APNで接続した複数のデータセンター間でGPUクラスタを分散配置し、データセンターの物理的な制約をなくすというコンセプトで推進されている取り組みだ。遠隔データセンターにあるGPUリソースもオンデマンドに確保し、大容量・低遅延のAPNを介して分散GPUクラスタを構成しつつ、各データセンターから移動させられない機密データの取り扱いも可能にする。
2024年10月には、秋葉原・三鷹の2拠点でのデータセンター間で、AIモデルを分散学習させる実証実験に成功。続いて2025年3月には、これを秋葉原・三鷹・川崎の3拠点に拡張して成果を得ている。
さらに今回は、3000km離れた分散データセンター環境を擬似的に再現し、分散学習の処理時間を計測する検証を行った。その結果、IOWN APN経由で長距離分散した場合でも、単一データセンターでの処理時間と比べて「約1.07倍」と、ほぼ同等の性能が得られた。ちなみに、インターネット経由で分散した場合の処理時間は「約5.10倍」だった。
加えて、GPU over APNの可能性を広げるための新たなアプローチとして、「データ転送の高速化」の検証が実施された。NTTドコモビジネスのイノベーションセンター IOWN推進室 担当課長である野山瑛哲氏は、「生成AIを活用する場合、GPUクラスタの分散のみならず、データセンター間の高速バックアップや災害時の高速データ転送が非常に有用になる」と、その必要性を説明する。













