グーグルは5月6日(現地時間)、AIモデル「Gemini 2.5 Pro」のアップデート版となる「Gemini 2.5 Pro Preview(I/O edition)」の早期アクセス版の提供を開始したと発表した。
今回のアップデートでは、特にコーディング能力が大幅に強化され、インタラクティブウェブアプリケーションの構築において顕著な進化を遂げている。当初は5月20日午前10時(太平洋時間、日本時間5月21日午前2時)から開催される開発者向けイベント「Google I/O」での発表を予定していたが、同モデルに対する高い期待に応える形で、より早期の提供が決定されたという。この背景には、Gemini 2.5 Proが持つコーディング能力やマルチモーダルな推論能力に対する圧倒的な好評価がある。
ウェブ開発能力で他を圧倒、動画理解も最先端
UI(ユーザーインターフェース)中心の開発だけでなく、コード変換や編集、さらには複雑な自律型ワークフローの開発といった多岐にわたるコーディングタスクにおいても改善が見られる。この強化により、Gemini 2.5 Proは、美しく機能的なウェブアプリを構築するモデルの能力を人間が評価する「WebDev Arena Leaderboard」において、前バージョンを147 Eloポイントも上回り首位を獲得した。
また、Gemini 2.5 Proは、その強力なネイティブマルチモーダリティと長文コンテキスト処理能力を維持しつつ、動画理解においても最先端の性能を発揮。動画理解に関するベンチマークテスト「VideoMME」では84.8%という高いスコアを記録している。これにより、開発者はテキストだけでなく、画像や音声、動画といった多様な情報を活用したアプリケーション開発が可能になる。
AIコーディングツール「Cursor」のCEOであるマイケル・トゥルーエル氏は、「最新のGemini 2.5 Proは、すでに強力な実世界のコーディング能力をさらに強化しています。新しいモデルでは、ツール呼び出しの失敗が大幅に減少し、ユーザーにとって2.5 Proが以前よりもさらに効果的になると考えています」と期待を寄せている。
開発者は、Google AI StudioおよびVertex AIを通じてGemini API経由で、このアップデートされたGemini 2.5 Proを利用開始できる。また、一般ユーザーもGeminiアプリ内で、例えば「Canvas」のような機能を通じてその恩恵を受けることができ、単一のプロンプトを入力するだけでインタラクティブなウェブアプリを構築することが可能になるとしている。
