田口和裕の「ChatGPTの使い方!」 第42回
ChatGPT、Gemini、Claude、Grokの違いを徹底解説!仕事で役立つ最強の“AI使い分け術”【2025年12月最新版】
2025年12月03日 13時00分更新
Google「Gemini 3 Pro」──推論・動画理解・アプリ生成の三本柱
Gemini 3 Proは、推論性能、動画理解、Googleクラウドとの統合を軸に強化されている。
生成UI(Generative UI)
質問に対して「使えるアプリ画面」をその場で生成する新機能。たとえば「為替レート計算機を作って」と頼むと、入力欄やボタンが配置された実際に動くアプリ画面が生成される。従来は「コードを書く→実行する→確認する」という手順が必要だったが、生成UIは質問だけで完結する。
ただし筆者の環境では、すべての質問で自動的にUIが生成されるわけではなく、Canvasモード(コード編集画面)やガイド付き学習モードなど、用途に応じたモード選択が必要なケースも多い。「完全に自動でアプリが出てくる」というよりは、「適切なモードを選べば、より簡単にアプリが作れる」機能と捉えたほうが実態に近い。
視覚・動画理解は本物
YouTube動画や手元のビデオファイルをアップロードすると、映像内容を理解したうえで質問に応答する。たとえば料理動画を見せて「この料理の材料リストを作って」と頼めば、映像から材料を抽出してリスト化できる。長時間の講義動画を要約したり、スポーツ映像から特定のプレイを分析したりといった使い方も可能だ。
特に注目すべきはUIの要素認識能力。ScreenSpot-Proというベンチマークでは11.4% → 72.7%へ飛躍しており、これは画面上のボタンやメニュー、入力欄といった要素を正確に識別できることを意味する。この能力はPC操作の自動化やWebスクレイピングなど、実務的なタスクに直結する。
Googleサービス連携
Gmail、カレンダー、ドライブを横断して情報を取得・処理できる。「来週の出張メールを探してカレンダーに追加し、関連資料をドライブから集めて」といった複数タスクを一括実行する。メールから日時を抽出してイベント作成、ドキュメント検索と要約、複数スプレッドシートのデータ統合など、自然言語の指示だけで完結する。Google Workspace利用者には最適のAIになる。
画像生成と会話的編集
画像生成は Nano Banana(Gemini 2.5 Flash Image)、および後継の Nano Banana Pro(Gemini 3 Pro Image)が担当する。最大の特徴は会話で編集を重ねていける点だ。「背景を雪山に」「髪を金髪に」「シャツをチェック柄に」と段階的に指示を出すことで、理想の画像に近づけていける。キャラクターの一貫性を保ちながら複数画像を生成したり、複数の画像を自然に融合させることも可能で、マーケティング素材やSNSコンテンツの制作効率が向上する。従来の「一発勝負で完璧なプロンプト」ではなく、試行錯誤しながら作り込める体験は完成度が高い。
参考:「ここがヤバい!「Nano Banana Pro」画像編集AIのステージを引き上げた6つの進化点(Ascii.jp)」
この連載の記事
-
第41回
AI
中国の“オープンAI”攻撃でゆらぐ常識 1兆パラ級を超格安で開発した「Kimi K2」 の衝撃 -
第40回
AI
無料でここまでできる! AIブラウザー「ChatGPT Atlas」の使い方 -
第39回
AI
xAI「Grok」無料プラン徹底ガイド スマホ&PCの使い方まとめ -
第38回
AI
【無料】「NotebookLM」神機能“音声概要”をスマホで使おう! 難しい論文も長〜いYouTubeも、ポッドキャスト化して分かりやすく -
第37回
AI
OpenAIのローカルAIを無料で試す RTX 4070マシンは普通に動いたが、M1 Macは厳しかった… -
第36回
AI
無料で「Gemini 2.5 Pro」が使える!グーグル「Gemini CLI」の使い方を簡単解説 -
第35回
AI
【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい -
第34回
AI
ローカルAI、スマホでサクッと動かせる グーグル「AI Edge Gallery」 -
第33回
AI
文章術としてのCursor入門 仕事で使うための実践編 -
第32回
AI
文章術としてのCursor入門 - この連載の一覧へ






