このページの本文へ

AIエージェントに選択肢 「AWS re:Invent 2025」レポート 第2回

GPUと専用チップで実現する最強のAIインフラ

カスタムシリコンがAIの未来を切り拓く AWSが自社開発チップの好調ぶりをアピール

2025年12月03日 09時00分更新

文● 大谷イビサ 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 2025年12月1日、Amazon Web Services(AWSはフラグシップイベント「AWS re:Invent 2025」を開催。2日の基調講演に登壇したAWS CEOのマット・ガーマン氏は、AIエージェントへの注力をアピール。新発表としてNVIDIA GB300を搭載した新インスタンスや特定顧客向けのAIインフラである「AWS AI Factories」などを発表し、AWSオリジナルのAIチップであるTrainiumの最新動向も披露した。

基調講演に登壇したAWS CEOのマット・ガーマン氏

最強のAIインフラをユーザー向けに提供する「AWS AI Factories」発表

 2025年のトレンドとなったAIエージェントに向けて、AWSもサービスの強化を進めている。ガーマン氏は、2006年の創業時から「発明の自由」を追求してきたAWSがAIエージェントに取り組むのは必然と説明。「技術的な興味から、真の価値をもたらすものへと変化し、あらゆる企業で、もっと発明が起こる」とアピールし、AIエージェントで重要なAIインフラ、推論プラットフォーム、組織内のデータ、エージェント向けツールの4つについて説明した。

 冒頭に披露したのは、性能と拡張性が欠かせないAIインフラだ。AWSはNVIDIAとのパートナーシップを通じて、最新のGPUの配備にこだわってきた。今回はNVIDIAの「GB300 NVL72」を搭載した「Amazon EC2 P6e-GB300インスタンス」と「P6e-GB300 UltraServers」を追加された。GB200と比較して、2倍のネットワーク帯域、1.5倍のメモリが提供され、もっとも要求の厳しいAIワークロードに対応する。プロダクションレベルでの1兆規模パラメーターのモデルの推論も可能になるという。

GB300搭載の新インスタンスを発表

 新たに発表された「AWS AI Factories」はスケール可能なAIインフラを特定顧客向けに提供する。NVIDIAのGPUやAWSのTrainiumチップを搭載した最新のAIコンピューティング環境、低遅延なネットワーク、高性能なストレージ、セキュリティサービスなどを包括的に提供し、Amazon BedrockやSage Maker AIも利用可能。エンタープライズや政府機関を対象としたコンプライアンスやソブリン(主権性)性を満たしつつ、自社データセンターで最新AIインフラの運用と統合管理が実現する。

最新のAIインフラを特定顧客向けに提供する「AWS AI Factories」

推論のほとんどはTrainiumで実行 配置数100万を超える

 また、ハイパフォーマンスな推論を可能にするAmazon EC2 Trainium 3 UltraServersの提供開始も発表された。最大144ものTrainiumチップを利用でき、362(FP8)ペタFLOPsを4倍の低遅延で実現。OpenAIのGPT-OSSのモデルを用いた前世代のTrainium 2 UltraServersと比べて、3.9倍のメモリ帯域幅、4.4倍の演算パフォーマンス、4倍以上のエネルギー効率で推論の高速化が達成されたという。

基調講演の壇上に登場したAmazon EC2 Trainium 3 UltraServers

 現状、Amazon Bedrockの推論のほとんどはTrainium上で実行されており、AnthropicのモデルはTrainiumのクラスターである「Project Rainier」で実現されているという。Trainiumの配置数も100万を超えることが発表された。

Trainimの配置数も100万を突破

 次世代のTrainiumであるAWS Trainium 4の開発意向も発表された。現行のTrainium 3の6倍(FP4)の高速化、4倍のメモリ帯域、2倍のキャパシティを目指すという。チップ間インターリンクであるNVIDIA NVLink Fusionをサポートし、NVIDIA MGXラックとシームレスに統合されている。GPUとTrainiumを統合したコスト効果の高いラックスケールのAIインフラが実現できるという。

 AWS re:Invent 2025の現地レポートは引き続きお送りする。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

アクセスランキング

  1. 1位

    TECH

    Claude CodeのPlan modeをやめてみる ~grill-meスキルで一歩ずつ設計を固め、アプリを作る~

  2. 2位

    ネットワーク

    「手のひらネットワーク機器」第4弾が登場、テーマは“ShowNetを手のひらに”! こだわりの両面マウントや高密度ポートも 6月11日発売

  3. 3位

    デジタル

    「そんなことも知らんで、介護やってるんですか?」 救急隊員の一言からkintone×AIの組織変革が始まった

  4. 4位

    TECH

    Obsidianで構築したエンジニアの「第二の脳」― 個人ナレッジベース構築のすべて

  5. 5位

    TECH

    FortiGateの圧倒的シェアをサプライチェーン防御に生かす フォーティネット 2026年度事業戦略

  6. 6位

    デジタル

    ブラックスケルトンモデルも登場!ヤマハ初のWi-Fi 7対応AP「WLX333」「WLX232」投入

  7. 7位

    ITトピック

    AIによるソフト開発加速の裏で「未テストの本番投入」も増加/「AIで日常生活が変わった」まだ45%/企業のコンサルへの不満、ほか

  8. 8位

    TECH

    出自で決まる「SASE」の最適解 主要外資ベンダー5社のコンセプトと強み

  9. 9位

    ビジネス・開発

    「デザインの仕事は半減するかもしれない」 MIXIデザイン本部が挑む「AIネイティブなものづくり」への転換

  10. 10位

    ビジネス・開発

    急増するトークン消費にマルチモデル化 AI活用は“見える化”してから広げる時代に

集計期間:
2026年06月03日~2026年06月09日
  • 角川アスキー総合研究所