このページの本文へ

AIエージェントに選択肢 「AWS re:Invent 2025」レポート 第2回

GPUと専用チップで実現する最強のAIインフラ

カスタムシリコンがAIの未来を切り拓く AWSが自社開発チップの好調ぶりをアピール

2025年12月03日 09時00分更新

文● 大谷イビサ 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 2025年12月1日、Amazon Web Services(AWSはフラグシップイベント「AWS re:Invent 2025」を開催。2日の基調講演に登壇したAWS CEOのマット・ガーマン氏は、AIエージェントへの注力をアピール。新発表としてNVIDIA GB300を搭載した新インスタンスや特定顧客向けのAIインフラである「AWS AI Factories」などを発表し、AWSオリジナルのAIチップであるTrainiumの最新動向も披露した。

基調講演に登壇したAWS CEOのマット・ガーマン氏

最強のAIインフラをユーザー向けに提供する「AWS AI Factories」発表

 2025年のトレンドとなったAIエージェントに向けて、AWSもサービスの強化を進めている。ガーマン氏は、2006年の創業時から「発明の自由」を追求してきたAWSがAIエージェントに取り組むのは必然と説明。「技術的な興味から、真の価値をもたらすものへと変化し、あらゆる企業で、もっと発明が起こる」とアピールし、AIエージェントで重要なAIインフラ、推論プラットフォーム、組織内のデータ、エージェント向けツールの4つについて説明した。

 冒頭に披露したのは、性能と拡張性が欠かせないAIインフラだ。AWSはNVIDIAとのパートナーシップを通じて、最新のGPUの配備にこだわってきた。今回はNVIDIAの「GB300 NVL72」を搭載した「Amazon EC2 P6e-GB300インスタンス」と「P6e-GB300 UltraServers」を追加された。GB200と比較して、2倍のネットワーク帯域、1.5倍のメモリが提供され、もっとも要求の厳しいAIワークロードに対応する。プロダクションレベルでの1兆規模パラメーターのモデルの推論も可能になるという。

GB300搭載の新インスタンスを発表

 新たに発表された「AWS AI Factories」はスケール可能なAIインフラを特定顧客向けに提供する。NVIDIAのGPUやAWSのTrainiumチップを搭載した最新のAIコンピューティング環境、低遅延なネットワーク、高性能なストレージ、セキュリティサービスなどを包括的に提供し、Amazon BedrockやSage Maker AIも利用可能。エンタープライズや政府機関を対象としたコンプライアンスやソブリン(主権性)性を満たしつつ、自社データセンターで最新AIインフラの運用と統合管理が実現する。

最新のAIインフラを特定顧客向けに提供する「AWS AI Factories」

推論のほとんどはTrainiumで実行 配置数100万を超える

 また、ハイパフォーマンスな推論を可能にするAmazon EC2 Trainium 3 UltraServersの提供開始も発表された。最大144ものTrainiumチップを利用でき、362(FP8)ペタFLOPsを4倍の低遅延で実現。OpenAIのGPT-OSSのモデルを用いた前世代のTrainium 2 UltraServersと比べて、3.9倍のメモリ帯域幅、4.4倍の演算パフォーマンス、4倍以上のエネルギー効率で推論の高速化が達成されたという。

基調講演の壇上に登場したAmazon EC2 Trainium 3 UltraServers

 現状、Amazon Bedrockの推論のほとんどはTrainium上で実行されており、AnthropicのモデルはTrainiumのクラスターである「Project Rainier」で実現されているという。Trainiumの配置数も100万を超えることが発表された。

Trainimの配置数も100万を突破

 次世代のTrainiumであるAWS Trainium 4の開発意向も発表された。現行のTrainium 3の6倍(FP4)の高速化、4倍のメモリ帯域、2倍のキャパシティを目指すという。チップ間インターリンクであるNVIDIA NVLink Fusionをサポートし、NVIDIA MGXラックとシームレスに統合されている。GPUとTrainiumを統合したコスト効果の高いラックスケールのAIインフラが実現できるという。

 AWS re:Invent 2025の現地レポートは引き続きお送りする。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

アクセスランキング

  1. 1位

    トピックス

    “持たない家電”ランキング、もはや定番のアレがやっぱり1位なような

  2. 2位

    ビジネス・開発

    こんどは“市区町村の財政状況”が丸わかり デジタル庁「ジャパン・ダッシュボード」に地方財政データ追加

  3. 3位

    ITトピック

    管理職ほど機密情報をAIに入力している実態、なぜ?/27卒学生の就職人気、IT業界トップ企業は/最新インシデントの傾向10パターンまとめ、ほか

  4. 4位

    トピックス

    ほぼスーパーで良くない? コンビニで「思ったより高い」と感じる人76%、実は中高年ほど割高感に悩んでるって知ってた?

  5. 5位

    トピックス

    若い人ほど「しっかり睡眠」、中高年は眠れないのか眠らないのか

  6. 6位

    トピックス

    【無双状態】2025年、最も雑誌の表紙を飾ったのは「えなこ」! 1万誌を調査して見えた圧倒的カバークイーン

  7. 7位

    TECH

    技術ニュースを毎朝スマホで流し読みしたい、だから自分専用サイトを開発した話

  8. 8位

    トピックス

    【人材争奪戦】大手企業の8割超が「高度IT人材」採用に危機感! 今一番欲しいのは「AI」と「セキュリティ」のプロだぞ

  9. 9位

    トピックス

    「寝不足だから仕事休むね」世界は7割、日本では4割が経験

  10. 10位

    ビジネス

    管理職こそ大事にしないとまずくないか? 約4割が「続けたい、と答えない」現実

集計期間:
2026年04月23日~2026年04月29日
  • 角川アスキー総合研究所