Anthropicは9月30日、新しい大規模言語モデル「Claude Sonnet 4.5」を発表した。「世界最高のコーディングモデル」とされ、複雑なエージェントの構築や、PC操作に強みを持つ。Claudeの全ユーザーが利用可能だ。
特に数学や論理推論の能力が強化されており、実際のソフトウェア開発能力を測る「SWE-bench Verified」でトップ級の成績を示したほか、現実的なPCタスクを評価する「OSWorld」でも、競合をおさえて61.4%のトップスコアを記録した。
特筆すべきは複雑で多段階の課題に30時間以上集中し続けられる点で、AIモデルとしては異例の粘り強さを示している。
発表と同時に、各種サービスの機能も強化している。
Claude Codeには、作業の進捗を保存したり直前の状態に戻せる「チェックポイント」機能を導入。APIでは長期タスクに対応するメモリ機能を加え、アプリ版では会話の中でコード実行やスプレッドシート・スライドの作成ができるようにした。
さらに、Anthropicが「Claude Code」を作ったときに使った基盤技術を一般開放した。開発者は、Anthropicの記憶の管理や、権限の調整、複数エージェントの協調などを参考にして、自前のAIエージェントを設計できる。
Claude Sonnet 4.5は、このところOpenAIのGPT-5やGoogleのGemini 2.5 Proに押され気味だったAnthropicが巻き返しをはかる大型のアップデートだ。ビジネスニーズに対応するフロンティアモデルとして、ふたたびリードを奪ってきた。







