第5世代TPU、独自Arm CPU、NVIDIA Blackwell搭載から「Vertex AI Agent Builder」まで
「生成AIはPoCから実践へ」Google Cloud Next '24で幅広い発表
生成AIエージェントを構築する「Vertex AI Agent Builder」を発表
寶野氏は、生成AIをめぐる現状について「2023年から2024年の年初にかけてのテーマは『PoC(実証)から実践に移ること』だった」と述べる。「実践」のためには、単にLLMなどの生成AIモデルを提供するだけでは不十分であり、ユーザーの目的にそれぞれ対応した生成AIアプリケーション=「エージェント」を構築できる生成AIプラットフォームであることが重要である。
基調講演でクリアン氏は、カスタマー、エンプロイー(従業員)、クリエイティブ、データ、コード、セキュリティと、エージェントの6つのパターンを紹介し、カスタマーエージェントの実践例としてメルセデス・ベンツの事例を紹介した。
今回は、Google Cloudの生成AIプラットフォーム「Vertex AI」の新たな目玉機能として、生成AIエージェントを構築する「Agent Builder」が追加された。Vertex AIが持つほかの機能、たとえば利用モデルを既存のもの選択できる「Model Garden」や、独自モデルを構築できる「Model Builder」とは異なり、それらのモデルを使ってアプリケーションを構築するうえでのカスタマイズ機能を提供する。
具体的には、生成AIの会話フローを制御して安全な対話型エージェントを実現する「Playbook Agent」(パブリックプレビュー)、LLMの回答にGoogle検索による情報ソースのリンクや検索の推奨結果を付与する「Grounding on Google Search」(パブリックプレビュー)、これと同様に社内データを使ったグラウンディングを行う「Grounding on Vertex AI Search」(一般提供開始)の各機能が発表されている。
Grounding on Google Search機能について、クリアン氏は、LLMのGeminiの回答を「世界で最も信頼されている情報」であるGoogle検索でグラウンディングできるようになることで「(Geminiの)回答品質を改善し、ハルシネーションを大幅に減らすことができる」と述べた。
Google検索によるグラウンディングの利用例として、寶野氏は、旅行業界におけるユースケースを紹介した。旅行予約に関する質問回答を行うエージェントを作成した場合、予約処理だけでなく、「目的地の観光情報が知りたい」といった質問にも回答できるようになる。「非常にニーズの高い機能」だと寶野氏は述べる。
さらに、RAGや検索の仕組みを自社開発する場合の構成要素を提供する「DIY Search and RAG」サービスも紹介した。たとえばRAGの正確性を高める機能、グラウンディングしたレスポンスを生成する機能などを、APIとして提供する。
「Gemini 1.5 Pro」モデルの追加、Geminiモデルのチューニング機能なども
Vertex AIのModel Garden、Model Builderのそれぞれでも、アップデートが発表された。
まずModel Gardenにおいては、ファーストパーティ(Google自身が開発する)のLLMであるGeminiのモデルとして、「Gemini 1.0 Pro」(一般提供開始)と「Gemini 1.5 Pro」(パブリックプレビュー)が新たに利用できるようになった。また、テキストにより画像を生成/編集できる「Imagen 2」、エンベディングを行う「Embeddings API」の双方が一般提供を開始した。
寳野氏によると、日本ではテレビ局のTBSがGemini 1.5 Proを使って、動画へのメタデータ付与作業を自動化しているという。また楽天がImagenを使って、出店者の製品写真をECで“映える”画像に自動変換しているそうだ。
またサードパーティのモデルでは、Anthropicの「Claude 3.0」などが追加された。オープンソースモデルでは、Googleの「Gemma」やその軽量版「CodeGemma」などが一般提供開始となっている。また、LLMリポジトリサービスの「Hugging Face」と連携して、Vertex AIから数クリックで、13以上のオープンモデルを利用できるようになった。
Model Builderにおいては、Geminiモデルのチューニング機能「Supervisedチューニング」(パブリックプレビュー)や、プロンプトデザインを効率的に行える「プロンプト管理」の機能拡張が発表された。
プロンプト管理では、プロンプトのバージョン管理、ノート、プロンプトが生成した結果を並べて比較できる機能などが加わる(パブリックプレビュー)。寳野氏は「プロンプトは精度を左右するため、プロンプトの管理は課題になっている」と説明する。モデルの定量的な評価を行う機能も加わっており、これを組み合わせて性能の高いプロンプトのバージョンはどれかを検証するといったことが可能になる。
* * *
基調講演の最後に、クリアン氏は「(今回は)AIスタックのすべてのレイヤーで新機能を発表した」と述べた。Google Cloudが提供するAIの特徴は「オープン性」であり、「トレーニングとサービスのチップ、モデル、開発環境、データベース、アプリケーションとすべてで顧客に選択肢を提供する」と明言した。人材面では20万人規模の生成AIトレーニングにコミットしていると語る。
クリアン氏は、AI技術をめぐって「われわれは重要な転換点にある」と述べたうえで、「ともに、真にオープンなAIプラットフォームを基盤とする生成AIエージェントの時代を作っていこう」と参加者に呼びかけた。
この記事の編集者は以下の記事もオススメしています
-
デジタル
「Vertex AI」の生成AI向け機能を強化、「AIを作る」発表まとめ -
デジタル
“AI一色”のGoogle Cloud Next 2023、「AIを作る」新発表まとめ -
TECH
Gemini 1.5 Proの特徴とは? Gemini API経由で試す -
TECH
新卒+Azure素人の「AI-102」学習&合格記 -
クラウド
BigQueryやLookerにもGeminiのパワーを ― Google Cloudデータ分析幹部に聞く -
デジタル
「ロックインは不可避、ならば使い倒す」Ubieエンジニアに聞くGoogle Cloud活用 -
クラウド
Google CloudとオラクルOCI、相互接続などの戦略的協業を発表 -
デジタル
VMware買収を変革のチャンスに、Broadcomと提携拡大したGoogle Cloudの狙い -
デジタル
脱コピペ作業 Looker Studioからのプレゼン作成をGeminiが自動で -
デジタル
あの大企業の生成AI活用が気になる Google Cloud Next Tokyoの準備はできてる? -
デジタル
「Gemini in BigQuery」「Spanner Graph」など、Google Cloudが多数の新機能を発表