グーグルは現地時間12月11日、最新AIモデル「Gemini 2.0」の発表と共に、複数のAIエージェントのプロトタイプを公開した。同社はGemini 2.0を、AIが人間に代わってより複雑なタスクを実行できるエージェントAI時代のモデルと位置づけている。
1つ目の「Project Astra」は、Android端末上で動作するAIアシスタントの研究プロトタイプだ。複数言語での会話や、アクセントや一般的でない単語の理解が強化され、Google検索、レンズ、マップなどのツールを使用できるようになっている。さらに、10分間のセッション内メモリと過去の会話の記憶機能を備え、よりパーソナライズされたアシスタントとして機能するという。
2つ目の「Project Mariner」は、ウェブブラウザー上でタスクを実行できる実験的なAIエージェントだ。Chrome拡張機能として提供され、ブラウザー画面上のテキスト、コード、画像、フォームなどの情報を理解して、タスクを実行できる。WebVoyagerベンチマークでは83.5%のスコアを達成したという。
開発者向けには「Jules」という実験的なAIコードエージェントが導入された。GitHubのワークフロー内に直接統合され、開発者の監督下で問題に取り組み、計画を立て、実行する能力を持つ。PythonとJavaScriptのコーディングに対応し、バグ修正を自動化できる。
具体的には、複数のファイルを同時に修正し、プルリクエストを準備できるほか、問題に対する多段階の計画を作成し、効率的に実行できるという。開発者はJulesが提案した計画を確認して、フィードバックを提供したり、調整を要求することもできる。
ゲーム分野では、Supercellとの協力により、「Clash of Clans」や「Hay Day」などのゲーム内でAIエージェントの実験が進められている。エージェントは画面上のアクションを理解して、リアルタイムで次のアクションを提案することができるという。
AIエージェントはAI市場の起爆剤になると期待されている。調査会社のResearchAndMarketsは、AIエージェント市場が2024年の51億ドルから2030年には471億ドルに急成長するという予測を出しており、Salesforceのマーク・ベニオフCEOは「エージェント革命はクラウド革命やソーシャル革命、モバイル革命と同様に現実のものであり、かつてない変革をもたらすだろう」と述べた。12月10日にはCognition社がAIソフトウェアエンジニア「Devin」の一般提供を開始している。