Inflection AI、インテル(R) Gaudi(R) AI アクセラレーターとインテル(R) Tiber(TM) AI クラウドを採用した企業向けAIシステムを発表

インテル株式会社
2024年10月09日

インテル株式会社
2024年10月7日に米国で発表された資料の抄訳です。

Inflection AIとインテルは本日、企業や開発者向けにAI（人工知能）の導入とその効果を増進させるための協業を発表しました。Inflection AIは、インテル(R) Gaudi(R) AI アクセラレーターとインテル(R) Tiber(TM) AI クラウド（AI Cloud）を採用した、業界初のエンタープライズ向けAIシステムとなるInflection for Enterpriseの提供を開始します。同システムは共感的で対話的、従業員に優しいAI機能を提供すると同時に、複雑で大規模な導入に必要な制御能力、カスタマイズ性、拡張性を提供します。このシステムは現在、AI Cloudを通じて提供開始されていますが、2025年第1四半期にはインテル(R) Gaudi(R)3 AI アクセラレーターを搭載した業界初のAIアプライアンスとして、顧客向けに出荷開始を予定しています。

「インテルは、Inflection AIとの戦略的なコラボレーションを通じて、迅速に高い成果をもたらすAIソリューションの新しい基準を確立しています。オープンソースのモデルやツールをサポートし、優れたワットあたりの性能（ワット／パフォーマンス）を提供するインテル(R) Gaudi(R) 3ソリューションは、あらゆる規模の企業が生成AIを手軽に、コスト効率高く、効率的に導入できるようにします」-- インテルコーポレーション主席副社長兼データセンター&AI事業本部本部長ジャスティン・ホタード（Justin Hotard）

注目される理由：通常、AIシステムの構築には、広範なモデル開発と学習、そしてエンジニアやデータサイエンティスト、アプリケーション開発者間の協力など、かなりのインフラが必要です。企業顧客は今日、Inflection 3.0に基づいて構築されたInflection for Enterpriseが有する包括的なAIソリューションを活用し、各社独自の企業データやポリシー、企業文化に特化した学習による仮想AI協働者を得て、従業員の能力を強化できます。インテルとのパートナーシップに基づき、効率的で高い効果、さらに業界をリードする価格性能比を提供するインテル(R) Gaudi(R) 3 AIアクセラレーターを活用し、比類のないパフォーマンスを実現します。インテルのテクノロジーは、高い効果をもたらす柔軟性と拡張性を有しています。加えて、AI クラウドは統一された環境でのAIアプリケーションの構築、テスト、デプロイを合理化し、市場投入までの時間を短縮します。インテルとInflection AIはこのサービスがもたらす価値と利点を考慮し、インテルがInflection for Enterpriseの初期顧客となることを視野にインテル社内でのデプロイに協力しています。

Inflection AI COO（最高業務責任者）テッド・シェルトン（Ted Shelton）は「私たちが会話する機会のあるCEOやCTOの全員が、市場の既存のAIツールが真に企業が求める高い信頼性を兼ね備えたエンタープライズ・グレードではない点にフラストレーションを感じています。企業や組織は、既製の汎用AIよりも優れたAIを求めていますが、自社でモデルをファインチューニングできる専門知識を持ち合わせていません。私たちはこれらの問題を解決するAIシステムを提供できることを誇りに思います。そして、私たちのシステムは、インテル(R) Gaudi(R)上での動作で得られるパフォーマンスの向上により、あらゆる企業のニーズにも対応できる拡張性を有しています」と述べています。

利用法：Inflection AIは、モデルを各組織に則したものになるようにファインチューニングを行い、ユーザー間での採用を加速し、企業のトーンや目的、そして独自の製品、サービス、運用情報との整合性を通じてユースケースの有用性を向上させます。Inflection 3.0は、従業員に優しい生成AI体験を通じて、企業顧客により迅速な価値実現を可能にすると同時に、価格、パフォーマンス、そしてセキュリティー／コンプライアンスの面で優位性を提供します。

- 生成AIの障壁を撤廃 - AIクラウド上に構築された「Inflection for Enterprise」は、企業がハードウェアのテストやモデル構築を行うことなく、整備投資を抑えながら迅速に拡張できるように設計されたアプリケーションテンプレートを提供します。2025年第1四半期には、顧客は完全なターンキー型AIアプライアンスとして「Inflection for Enterprise」を購入するオプションも利用可能になります。このアプライアンスではインテル(R) Gaudi(R)3 AI アクセラレーターを搭載し、現在の競合製品と比較して、価格性能が最大2倍向上し、さらに128GBの高帯域幅メモリー容量の活用により、生成AIの性能をさらに最適化できます。
- 価格／性能の最適化 - Inflection AIの消費者向けアプリケーションPiはこれまでNVIDIAのGPUで動作していましたが、Inflection 3.0ではインテル(R) Gaudi(R)3 AI アクセラレーターを採用し、オンプレミスまたはクラウド上のAI Cloudにより運用されます。これにより、デプロイまでの時間が短縮されるだけでなく、総所有コスト（TCO）も削減されます。
- 企業向けに最適化 - Inflection AIのチャット型AIツールのPiによる微調整および人間のフィードバックによる強化学習（RLHF）の専門知識を活用し、Inflection for Enterpriseのモデルはそれぞれの企業の理念や運営方法に合わせた独自の仕様となります。企業の歴史や方針、コンテンツ、トーン、製品、運営情報に基づくデータやインサイトを基にモデル化され、Inflection AIは組織全体の生産性向上と一貫性の推進に貢献します。
- 所有権とセキュリティーの強化 - Inflection for Enterpriseは、企業が自社のインテリジェンスを完全に所有できるようにします。微調整されたモデルは顧客専用のものであり、外部の組織と共有されることは一切ありません。さらに、顧客はモデルをオンプレミス、クラウド、またはハイブリッドのいずれかの選択したアーキテクチャ上でホストし、実行できます。

今後の展開：今後、Inflection AIとインテルは、開発者がInflection for Enterprise向けの企業アプリケーションを構築できるようにします。これは、堅牢で人間中心のInflection 3.0システムを活用して、重要なソフトウェアツールを生成するためのものです。Inflection for Enterpriseの詳細やデモ・サインアップは、Inflection AIのウェブサイト（ https://inflection.ai/intel ）をご覧ください。

Source: Intel measured results vs H100 data sources: https://github.com/NVIDIA/TensorRT-LLM/blob/main/docs/source/performance/perf-overview.md input-output
Sequences: 128-2048tps on 2 accelerators/GPUs. Intel results obtained on September 9th 2024.
Hardware: Two Intel Gaudi 3 AI Accelerators (128 GB HBM) vs two Nvidia H100 GPU (80 GB HBM).
Software: Intel Gaudi software release 1.18.0.
See Nvidia link for H100 software details.
Results may vary.
Pricing estimates based on publicly available information and Intel internal analysis