このページの本文へ

OpenAI、最強の推論モデル「o3」 ChatGPTの全機能を使いこなす“エージェント”的モデル

2025年04月17日 09時15分更新

文● G. Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 OpenAIが4月16日(米国時間)、新たなAIモデル「o3」と「o4-mini」を発表した。「ChatGPT」有料会員向けに同日から提供を開始している。

 o3は同社がこれまでで最高性能を持つ推論モデルで、従来の「o1」から大きく進化した次世代モデル。特にコーディングや数学、科学、視覚認識などの分野で強みを発揮し、複数のベンチマークで最高記録を更新した。一方のo4-miniは、o3に比べて推論能力が低いものの、応答速度やコスト効率に優れ、大量の問い合わせやリアルタイム応答に適したモデルだ。

 両モデルは「エージェント的な訓練」を受けている点が特徴。Web検索、画像認識、画像生成、コード(Python)の実行など、ChatGPTに実装されたすべてのツールを自律的に組み合わせて活用できるエージェント的な機能を持つ。これまでどおりにユーザーの指示を受けると、必要なデータや文脈を自ら収集し、複数のステップを踏んで回答を出せるようになった。

 内部的な思考連鎖(Chain of Thought)を応答前に長く実行するように設計されており、複雑な問題解決能力も大幅に向上している。画像や図表などを深く理解し、画像を操作しながら思考する「Thinking with images」機能も搭載した。これによりマルチモーダル性能が向上し、コーディング、数学、科学などの分野で高いパフォーマンスを出せるようになった。

 開発者向けにはAPIや、ターミナル上で動作するオープンソースのコーディングエージェント「Codex CLI」も同時に発表している。なおo4-miniは、先日発表された「GPT-4.1」と同様に、統合開発環境「Cursor」および「Windsurf」で一定期間無料で試すことができる。

 

■関連サイト

カテゴリートップへ

ピックアップ