グーグルは8月1日(現地時間)、同社のAI「Gemini」アプリにおいて、新機能「Deep Think」を「Google AI Ultra」のサブスクリプション登録者向けに提供を開始したと発表した。同機能は、より複雑で創造的な問題解決を可能にするためのもので、高性能なAIツール群の最新機能として位置づけられている。
じっくり考えるAI、並列思考で複雑な問題に挑む
今回リリースされたDeep Thinkは、開発者向けイベント「Google I/O」で発表された初期バージョンから大幅に改善されている。これは、今年開催された国際数学オリンピック(IMO)で金メダル級の実績を達成したモデルの派生版でありながら、日常的な利用シーンを想定してより高速に動作するよう調整されているという。グーグルの社内評価によると、2025年のIMOベンチマークで銅メダルレベルの性能に到達しており、創造的な問題解決における強力なツールとなる可能性を秘めている。
Deep Thinkの最大の特徴は、人間が難問に取り組む際に多角的に検討するように、「並列思考」技術を用いている点だ。このアプローチにより、Geminiは一度に多くのアイデアを生成し、それらを同時に比較検討できる。さらに、AIが思考に使える「推論時間」を延長することで、さまざまな仮説を探求し、最終的に最適な答えを導き出すことが可能になった。グーグルは、この拡張された思考プロセスを有効活用するよう促す新しい強化学習技術も開発しており、時間とともにより直感的で優れた問題解決能力を獲得していくという。
では、この高度な思考能力は具体的にどのような場面で役立つのか。グーグルは、創造性や戦略的計画、段階的な改善が求められるタスクでその性能が発揮されるとしている。例えば、Webサイト開発において、単にコードを生成するだけでなく、デザインの美しさと機能性の両方を向上させることができたという。また、複雑な科学論文を読解したり、数学的な予想を立てて検証したりといった研究活動を加速させるツールとしても期待される。特に、問題の定式化やトレードオフの慎重な検討が重要となる、難易度の高いコーディング問題において優れた性能を発揮するとのことだ。
その性能は、コーディング能力や科学知識を測定する「LiveCodeBench V6」や「Humanity's Last Exam」といった高難易度のベンチマークテストにおいても、最先端のスコアを記録していることからも裏付けられている。
グーグルは、Geminiの能力向上に伴い、安全性と責任への取り組みも継続している。テストでは、Deep Thinkは既存の「Gemini 2.5 Pro」と比較してコンテンツの安全性や客観性が向上した一方、無害なリクエストを拒否する傾向がわずかに高まったという。同社は今後もフロンティアセーフティ評価などを通じて、AIの高度化に伴うリスクを精査し、対策を講じていく方針だ。
Google AI Ultraのサブスクリプション登録者は、8月1日(現地時間)よりGeminiアプリでDeep Thinkを利用できる。モデル選択画面で「2.5 Pro」を選び、プロンプト入力欄の「Deep Think」をオンにすることで有効化され、1日あたりのプロンプト数に制限はあるものの、コード実行やGoogle検索といったツールと連携し、より長く詳細な回答を生成できる。グーグルは今後数週間以内に、開発者や企業向けにGemini API経由での提供も予定しており、その活用事例に期待を寄せている。









