このページの本文へ

前へ 1 2 次へ

800G-ZR+RDMA最適化で「1.6TBを1分強で転送」、3000km離れたAI分散学習の実証実験も

NTTドコビジ、AI/GPUクラスタのDC分散にまた一歩 800Gbps通信で新たな実証に成功

2025年09月01日 08時00分更新

文● 福澤陽介/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 NTTドコモビジネス(NTTドコビジ、旧NTTコミュニケーションズ)は、2025年8月27日、データセンター間のデータ転送を高速化する新たな実証実験の結果を発表した。

 今回の実験では、約40km離れたデータセンターにサーバーを分散配置し、データセンター間をつなぐ800Gbps光通信技術とRDMA(Remote Direct Memory Access)技術を組み合わせることで、1.6TBの大容量データをわずか1分余り(68.8秒)で転送することに成功した。遠隔データセンターに分散配置されたGPUリソースの、大規模なAI処理における柔軟な活用、効率性の向上などが期待できるという。

 あわせて、3000km離れたデータセンター間でのAI分散学習の実証結果も公表している。こちらでは、単一データセンターで処理する場合とほぼ同等のパフォーマンスが実現できることが確認されている。

「データの高速転送」の実証実験

AI時代の分散データセンター需要増加と、それを支えるIOWN APN

 生成AIの処理には、大量の計算機資源が必要となる。1台のGPUサーバーに搭載できるGPUの数には限りがあるため、複数台のGPUサーバーを束ねて分散処理を行う「GPUクラスタ」の需要が拡大している。

 ただし、GPUサーバーなどのGPUインフラを格納するデータセンターにも、給電能力や冷却能力、床荷重といった制限がある。そのため、GPUクラスタが1つのデータセンターに収まらなくなり、やむを得ずデータセンターを分散化するケースが発生しているという。また他方では、事業継続・災害復旧の観点から、GPUインフラのデータセンターをあえて分散化するケースもある。

 さらに、経済産業省の「デジタルインフラ(DC等)整備に関する有識者会合」においても、オール光ネットワークを用いて「全国にデータセンターインフラを分散させることを検討すべき」という見解が示されている。

 こうした状況の中、NTTドコモビジネスでは、2025年6月にAI時代の次世代ICT基盤である「AI-Centric ICTプラットフォーム」構想を発表した。その要素技術のひとつが、大容量・低遅延・低消費電力を特徴とするオール光ネットワーク「IOWN APN(All-Photonics Network)」である。

AI-Centric ICTプラットフォーム

 同社はこのIOWN APNを用いて、GPUインフラの分散ニーズに選択肢を提供する「GPU over APN」の検証を進めている最中だ。

3000km離れた分散データセンターでも実用的な生成AI学習が可能

 GPU over APNは、IOWN APNで接続した複数のデータセンター間でGPUクラスタを分散配置し、データセンターの物理的な制約をなくすというコンセプトで推進されている取り組みだ。遠隔データセンターにあるGPUリソースもオンデマンドに確保し、大容量・低遅延のAPNを介して分散GPUクラスタを構成しつつ、各データセンターから移動させられない機密データの取り扱いも可能にする。

GPU over APNのコンセプト

 2024年10月には、秋葉原・三鷹の2拠点でのデータセンター間で、AIモデルを分散学習させる実証実験に成功。続いて2025年3月には、これを秋葉原・三鷹・川崎の3拠点に拡張して成果を得ている。

 さらに今回は、3000km離れた分散データセンター環境を擬似的に再現し、分散学習の処理時間を計測する検証を行った。その結果、IOWN APN経由で長距離分散した場合でも、単一データセンターでの処理時間と比べて「約1.07倍」と、ほぼ同等の性能が得られた。ちなみに、インターネット経由で分散した場合の処理時間は「約5.10倍」だった。

遠距離対応に向けた分散学習の実証結果

 加えて、GPU over APNの可能性を広げるための新たなアプローチとして、「データ転送の高速化」の検証が実施された。NTTドコモビジネスのイノベーションセンター IOWN推進室 担当課長である野山瑛哲氏は、「生成AIを活用する場合、GPUクラスタの分散のみならず、データセンター間の高速バックアップや災害時の高速データ転送が非常に有用になる」と、その必要性を説明する。

NTTドコモビジネス イノベーションセンター IOWN推進室 担当課長 野山瑛哲氏

前へ 1 2 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  6. 6位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  9. 9位

    TECH

    業界横断で“サイバー攻撃から供給網を死守” NTT・アサヒ・トライアルらが「流通ISAC」始動

  10. 10位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

集計期間:
2026年04月08日~2026年04月14日
  • 角川アスキー総合研究所