OpenAIが3月5日、最新のAIモデル「GPT-5.4」をリリースした。ChatGPTでは「GPT-5.4 Thinking」としてPlus、Team、Proユーザー向けに段階的に展開される。APIとCodexでも利用可能で、APIではgpt-5.4という名前で即時アクセスでき、より高性能な「GPT-5.4 Pro」もgpt-5.4-proとして提供されている。
PCを直接操作できるネイティブ機能が特徴。スクリーンショットを見てマウスやキーボードを動かし、ソフトウェアを操作することができる。OSWorld-Verifiedというベンチマークでは人間の成功率72.4%を上回る75.0%を達成し、業界トップの成果を見せた。
コンテキスト長は最大100万トークンに拡大され、巨大なコードベースや長文書類を一度に扱えるようになった。複雑なコーディングやツールを多用する長い作業でも効率が大幅に向上し、ツール検索の仕組みでは不要な定義を減らしたことで、トークン使用量を47%削減した例もあったという。
専門業務のベンチマークGDPvalでは83.0%のスコアを出し、業界プロフェッショナルと同等かそれ以上の性能を示した。スプレッドシート作成やフロントエンドコード生成、複雑な数学、資料理解といったタスクで特に強みを発揮する。
デモ動画ではPlaywrightを使ったブラウザ操作や3Dチェスアプリの構築・テストを自動でこなし、自己検証を繰り返しながらトークン消費を大幅に抑える様子が披露されている。







