このページの本文へ

田口和裕の「ChatGPTの使い方!」 第35回

【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい

2025年06月27日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

【神機能1】リアルタイム音声対話

 Google AI Studioで注目すべき機能の一つが、Gemini 2.5の「Native Audio Output」を活用した、音声で話しかけると自然な音声で返答してくれるリアルタイム音声対話機能だ。日本語を含む24言語以上に対応しているため、英語が苦手でも安心して利用できる。

 競合のChatGPTにも「Advanced Voice Mode」という同等の機能があるが、有料プラン(月額約3000円)でも1日あたり約60分の使用制限がある。無料プランではさらに短く、具体的な上限は非公開だが、制限に達してしまうと低性能モードに自動的に切り替わるというなんとも使い勝手の悪い仕様になっている。

 では実際に使ってみよう。Google AI Studioにログインし、左側サイドメニューから通常の「Chat」ではなく「Stream」をクリック。

 「Stream」画面が表示されたので、画面右上から利用するモデルを選択しよう。

 現在利用できるのは下記の3モデル。通常はデフォルトのGemini 2.5 Flash Preview Native Audio Dialogを選んでおけばよい。

Gemini 2.5 Flash Preview Native Audio Dialog:リアルタイム音声対話専用モデル。音声で話しかけて音声で返答を受け取れる

Gemini 2.5 Flash Exp Native Audio Thinking:音声対話に思考プロセス表示機能を追加したモデル。AIの推論過程を確認可能

Gemini 2.0 Flash 001:標準的なテキストベースの対話モデル。高速レスポンスが特徴

 画面下部の「Talk(マイク)」アイコンをクリックして音声入力を開始すると、数秒後、AIが自然な日本語音声で回答する。

 音声会話時、プロンプトウィンドウは下記のような表示になる。

 会話ログはこのように表示される。後で聞き直すことも可能だ。

会話ログ

 特筆すべきは感情認識対話機能だ。ユーザーの声に含まれる感情を検知し、楽しそうに話しかければ明るく返答し、困りながら相談すれば親身になって答えてくれる。画面共有機能により、作業中の資料を見せながら音声で質問することも可能だ。

 ビジネスでは会議前の資料整理やプレゼン練習、外国人との会議での通訳代わりとして、日常では英会話の練習相手や、料理中・運転中など手が離せない状況での音声利用が便利だ。

カテゴリートップへ

この連載の記事
ピックアップ