前へ 1 2 3 次へ

新しい「ChatGPT」はココがすごい　解説「GPT-4o」

2024年05月15日 09時30分更新

文● 田口和裕

画像生成も大幅改良

　不思議なことにデモンストレーションではまったくと言っていいほど触れられていなかったが、何気にすごいのが画像生成だ。

　詳しくは「画像生成AIとしても超進化したChatGPT「GPT-4o」」という記事にまとめたので、そちらを参照してほしい。

音声会話機能の強化

　加えて、デモンストレーション動画の中でもいちばんインパクトがあったのが音声会話機能だろう。

　音声入力の応答速度は最短で232ミリ秒、平均で320ミリ秒。これは会話における人間の応答時間と同等だという。

　この動画ではChatGPTに1から10までカウントしてもらっているのだが、「もっと早く」「ゆっくり」といったユーザーの指示にほぼリアルタイムで反応しているのに驚く。

　この動画はカメラで犬を撮影しながら、その犬に向けてChatGPTが言葉をかけているのだが、子どもをあやすような口調で語りかけているのがわかる。

　このように、反応速度の向上だけではなく、どうやら話し方のバリエーションや感情の表現まで可能になっているようなのだ。

　ChatGPTにはこれまでも音声会話機能は実装されていたが、GPT-3.5では平均2.8秒、GPT-4では5.4秒の遅延があった。理由としては、「音声認識（Whisper-v3）」「LLM（GPT-4など）」「音声合成（TTS）」の3つの独立したモデルのパイプラインになっていたからだ。

　GPT-4oは、テキスト、画像、音声すべてを同じニューラルネットワークで処理しているため、音声のトーン、複数の話者、背景ノイズといった情報も考慮し、笑い声、歌、感情表現を出力できるようになったという。

　こちらは、言語ごとの音声認識性能をこれまで使われていた同社の「Whisper-v3」と比較したものだ。英語はもちろんすべての言語でGPT-4oの方が優れた成績を見せていることがわかる。

　将来的には、より自然なリアルタイムの音声会話や、リアルタイムのビデオを通じてChatGPTと対話する機能が追加される予定だ。

誰もがGPT-4の実力を試せるように

　高性能化よりも高速化に舵を切ったことで計算資源に多少余裕ができたのだろうか、GPT-4oは使用制限付きだが無料ユーザーにも公開されることになっている。

　それにともないWeb検索、データの分析とチャートの作成、写真やファイルのアップロード、GPTsおよびGPTストアの利用、メモリー機能といった従来月額20米ドル（およそ3130円）の「ChatGPT Plus」に加入しなくては利用できなかった機能を無料ユーザーも使えるようになる。

　つまり、これまで「GPT-3.5」しか触ったことのなかった大部分のユーザーが初めてGPT-4の実力を実感することができるようになるのだ。これは思っているよりも大きな事件かもしれない。

　なお、GPT-4oはAPI経由でも利用できる。価格は100万トークンあたり入力が5米ドル（およそ780円）、出力が15米ドル（およそ1560円）とGPT-4 Turbo（入力10米ドル、出力30米ドル）の半額になっている。これも高速化の恩恵だろう。

macOS用デスクトップアプリ

　macOS用のデスクトップアプリもリリースされる。WindowsのCopilotのようにキーボードショートカット（Option + Space）ですぐにChatGPTを呼び出して質問できる。スクリーンショットを撮影して直接アプリ内で議論することもできるようだ。

　また、デスクトップアプリの右下にあるヘッドフォンアイコンをクリックすることで音声会話を始めることも可能だ。

　新しいアイデアのブレインストーミング、面接の準備、特定のトピックについてのディスカッションなど、さまざまな用途に活用できるとしている。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

AIオススメ記事

2024年06月07日

AI

めちゃ便利になった無料版「ChatGPT」新機能の使い方まとめ【最新版】
2024年05月27日

AI

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場
2024年06月15日

AI

情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ！！
2024年05月29日

AI

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる
2024年06月24日

AI

“革命”起こした画像生成AIに暗雲　「Stable Diffusion 3 Medium」の厳しい船出
2024年06月17日

AI

AIが作る3Dモデルの完成度が上がってきた　毎回異なるモンスターが生成されるゲームも実現か
2024年05月21日

AI

しまむら、AIモデル「るな」起用　20歳の服飾専門学生（という設定）
2024年05月31日

AI

画像生成AI「Midjourney」の使い方　思いどおりの絵を出すための「パラメーター」まとめ【最新版】
2024年06月19日

AI

画像生成AI「Midjourney」の使い方　画風やキャラクターを固定する「スタイルリファレンス」「キャラクターリファレンス」はこう使う
2024年06月10日

AI

アドビの画像生成AI機能がまた進化　白黒3Dモデルがリアルな都市に

ピックアップ

sponsored
Backlogが実現する離れた場所でもチームワークマネジメント

コミュニティイベントの回し方、CMC_Centralの舞台裏を運営チームに聞いてみた
sponsored

お手ごろ価格の“AI PC”、ASUS「Zenbook 14 OLED UX3405MA」は美しさ・軽さ・駆動時間を追及した優れモノだ！
sponsored
これ以上は望めない、i9-14900HX、RTX 4090、メモリ128GB、SSDはRAID 0で4TB

圧倒的に速くてストレス一切なし、全パーツが最上位のゲーミングノートPC「Titan 18 HX A14V」シリーズ徹底レビュー
sponsored

デスクトップPC並のCPU＆GPUに高解像度＆240Hz対応！セール中の本格ゲーミングノートに注目！
sponsored

置き場所自由な高性能なRyzen搭載の小型PCが魅力的！しかも価格もオトクだ！
sponsored
2.4GHz接続時で最大105時間、Bluetoothで最大210時間のロングバッテリーも魅力！

選択肢が減ってる大きめ・軽量ゲーミングマウスならコレ！左だけでなく右サイドにも2ボタンあるぞ
sponsored
最新世代QD-OLED採用の4K解像度で240Hz駆動、0.03msの応答速度を実現

一度画面を見たら液晶では満足できなくなる…究極のゲーミングディスプレー「MPG 321URX QD-OLED」のヤバさをレビュー
sponsored
Core i7-14700Fでメモリーは32GB、FRONTIERの「FRGHLB760/WSA」をチェック

性能・冷却・デザイン・価格の平均点がかなり高いRTX 4070 SUPERゲーミングPC、25万円台から！
sponsored
快適な着け心地なのにノイズキャンセリング性能は大幅にアップした！

没入感の高さが印象的！強力ANC搭載のファーウェイ製イヤホン「HUAWEI FreeBuds 6i」レビュー
sponsored
ビジネスPC／スマートフォン／サーバーをまとめて保護する「ESET スモールビジネスセキュリティ」

数名規模の小さな会社に最適！丸ごとセキュリティ対策できるソフト
sponsored
16型「Alienware m16 R2」をチェック、仕事にも便利な機能も多く搭載

ガチゲーマーにこそ性能も技術も詰まったゲーミングノートPCを持ってほしい！買うならAlienwareの16型だ！
sponsored
8人のエバンジェリストが熱血対談！　これは見逃せない！

トヨクモkintoneフェスの「kintoneエバンジェリストしゃべり場」が濃厚すぎる
sponsored
ファッショナブルなデザインに、ヘルスケアやワークアウトの機能が充実！

「HUAWEI WATCH GT 4」はバッテリー長持ち＆デザイン色々、あらゆる人にオススメ可なスマートウォッチの本命！
sponsored
PC/IT系編集者の心構えに通ずるありがたい説法も

再起の時来たれり！インテルPCマイスター上級試験・不合格者のための補講を受けた話【実技編】
sponsored
次回の試験前にぜひ学んでほしい傾向と対策

再起の時来たれり！インテルPCマイスター上級試験・不合格者のための補講を受けた話【筆記編】
sponsored

マザーの背面コネクターって実際どう？ASUS「BTF」で組んでみたら世界が変わった
sponsored

知っておいて損はなし！耐久性◎なCrucialポータブルSSDの選び方・使い方を大紹介
sponsored

クリエイターPCの選び方　写真、動画編集、3DCGのガチプロにオススメのWindowsノートはこれでした
sponsored
新色ベージュが追加＆アップデートで待望のイヤホン単体でのボリューム調整にも対応！

耳を塞がない＆メガネ派もOK！ファーウェイの独自スタイルのオープンイヤー型イヤホンはながら聴きに最適！
sponsored
結局どっちがお得？考え方の違い、クラウドストレージのコストを最小限に抑える方法

ファイルサーバー／NASとクラウドストレージの「コスト」を比較する
sponsored
Northを使ったオシャレPCと、会社の生放送で活躍できる最強PCが爆誕！

PCケースもパーツも！イッペイ＆つばさが理想のBTOPCをカスタマイズ、どんな構成に？
sponsored
JN-MD-IPS133WUXGARをレビュー

16：10で1920×1200ドットの13.3型モバイルディスプレーが2万円は無敵！でも……
sponsored
X-360Q（JN-27IPS360WQHDR-HSP）をレビュー

360Hz・WQHDの27型ゲーミングディスプレーが9万円台！ KVMも90W給電も使えてお得感大

新しい「ChatGPT」はココがすごい 解説「GPT-4o」

画像生成も大幅改良

音声会話機能の強化

誰もがGPT-4の実力を試せるように

macOS用デスクトップアプリ

この記事の編集者は以下の記事をオススメしています

AI 漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ

AI OpenAI「ChatGPT」新機能発表へ グーグルのイベントにぶつける“伝統芸“披露

AI 画像生成AIとしても超進化したChatGPT「GPT-4o」

AI グーグル、2TBのストレージと最新AIが使えて月2900円の「AIプレミアム」

AI ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）

AI 無料版「ChatGPT」機能増えまくり GPTs、Web検索、画像入力、データ分析など可能に

AI 「ChatGPT」Macアプリ ダウンロード方法と使い方

AI 「教育用ChatGPT」登場 企業向けより安く提供

ビジネス 相次ぐ論文撤回で揺れる物理学界／GPT-4oの中国語に異常

TECH ChatGPT-4oを使い、爆速で英語論文を理解する方法を教えます

AIオススメ記事

ピックアップ

新しい「ChatGPT」はココがすごい　解説「GPT-4o」

AI
漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ

AI
OpenAI「ChatGPT」新機能発表へ　グーグルのイベントにぶつける“伝統芸“披露

AI
画像生成AIとしても超進化したChatGPT「GPT-4o」

AI
グーグル、2TBのストレージと最新AIが使えて月2900円の「AIプレミアム」

AI
ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）

AI
無料版「ChatGPT」機能増えまくり　GPTs、Web検索、画像入力、データ分析など可能に

AI
「ChatGPT」Macアプリ　ダウンロード方法と使い方

AI
「教育用ChatGPT」登場　企業向けより安く提供

ビジネス
相次ぐ論文撤回で揺れる物理学界／GPT-4oの中国語に異常

TECH
ChatGPT-4oを使い、爆速で英語論文を理解する方法を教えます