1兆ドル規模に拡大するAI市場に向け、インテルがパートナーと決起集会
富士通、NTTデータがGaudiとNVIDIAのベンチを披露 Intel Connection 2024基調講演
2024年09月04日 07時00分更新
エンタープライズでのAI利用を加速させるGaudi
再び壇上に戻ってきた大野氏は、生成AIの企業導入における課題として、データの活用について語る。
従来、エンタープライズ企業において用いられてきたデータは「ダークデータ」と言われる機密性の高いデータで、データセンターにおいてXeonのようなCPUで計算処理を行なってきた。一方、現在もてはやされてる生成AIのような学習モデルでは、その真逆と言われるデータで、急速な進化を前提にAIアクセラレーターで処理を行なっている。この間を埋める手法が検索拡張生成と言われるRAGで、LLMに企業内のデータを取り込むことで、ハルシネーションの少ない精度の高いAIを実現する。
こうしたエンタープライズの生成AIへの支出は、2027年までに現在の4倍に当る1510億ドル(22兆円規模)に拡大すると見込まれている。こうした企業での利用においては、個々の企業にフィットしたオープンなAIエコシステムが重要。RAGを活用することで、セキュリティの高い、ドメインに特化した生成AIを構築することが可能になるという。
こうしたニーズに応えるのが、インテルのAIアクセラレーターであるGaudiになる。2年前に発表されたGaudi2に引き続き、4月に発表されたGaudi3は大幅な性能強化を遂げており、GPT3-175Bにおける学習性能では、8194台のクラスター構成でNVIDIA H100と比較し、40%の高速化を実現しているという。また、LLAMA2-70Bの推論スループットに関しても64アクセラレーターの構成で15%の高速化が見られるとのことだ。
ベンチマークを受けた大野氏は、「インテルのベンチマークなので、いいとこどりをされているのでは?という疑問を持たれるのも当然かと思う」とコメントし、Gaudiの評価を行なった富士通とNTTデータをゲストとして招へいする。
1.8倍高いコストパフォーマンスは大きなインパクト(富士通)
1社目のゲストはインテルのパートナーでもあり、Gaudiの国内初導入のユーザーでもある富士通の執行役員EVP 富士通研究所所長の岡本青史氏になる。
富士通は、社会課題の解決と事業を両立する新しいビジネスモデル「Fujitsu Uvance」を展開している。AIに関しては、コンバージェンステクノロジー、コンピューティング、ネットワーク、データ&セキュリティなどとともに5つの技術領域の中心に位置づけられており、昨年は最先端技術を搭載した「Fujitsu Kozuchi」というAIプラットフォームの提供を開始した。また、6月には企業向けの生成AIフレームワークや効率性と消費電力の削減を可能にするコンピューティングの融合を進めている。AIの導入実績はすでに7000件に及んでいるという。
最近のトピックとしては、カナダのトロントに本拠を置くAIスタートアップCohere(コヒア)との提携が挙げられる。Cohereは他のAIスタートアップと異なる企業向けに特化したLLMを開発しており、RAGやリランキング、エンベディッドなどの技術を用いて、ビジネスタスクに対して簡単にカスタマイズできるという。このCohereの技術と富士通独自の日本語特化技術やファインチューニングなどを組み込わせて生まれたのがエンタープライズ向け業務特化型LLMの「Takane」になる。「さまざまな企業で使っていただける革新を起こすモデルとなっている」と岡本氏は語る。
インテルGaudiアクセラレーターについては、AIで特に重要となるAllreduceでのグラフを披露し、台数に比例して線型に性能向上できる点を説明。「通信性能のスケーラビリティが非常に高いのが魅力」と岡本氏は語る。また、Llama 2 70BのファインチューニングにおけるNVIDIAのH100とGaudi 2の比較でも、Gaudi 2の方が実行効率が高く、「スケーラビリティのよさと安定的な挙動と大規模な性能が期待できる」(岡本氏)とコメントした。
そしてより重要なコストパフォーマンスに関しても、同社の試算ではGaudi 2の方が約1.8倍高く、「かなりインパクトのある数字」と評価した。岡本氏は、最新のGaudi 3にも高い期待を示し、「今まで築いてきたインテル様との強固なパートナーシップをさらに拡大することで、両社の成長のみならず、お客さまの発展、社会課題の解決にも取り組んでいきたい」と抱負を語った。