AI企業Anthropicは2月24日、最新AIモデル「Claude 3.7 Sonnet」に新機能「拡張思考モード」を導入したと発表した。長い時間をかけて“深く”思考することで、より正確な回答を提供できる。数学、物理学、コーディング、複雑な指示の処理など、さまざまな分野でのパフォーマンスが向上することが期待されている。
拡張思考モードでは一連の思考プロセスも可視化されるため、ユーザーはClaudeが結論を出すまでの過程を確認できる。
Claude 3.7 Sonnetはエージェント能力も向上しており、コンピューター操作のタスクをより効率的にこなせるようになっている。ベンチマークテスト「OSWorld」では、仮想環境でのコンピューター操作の精度が向上していることが確認された。ゲーム「ポケットモンスター 赤」をプレイする実験では、過去のバージョンではゲーム序盤で行き詰まっていたのに対し、ゲーム内のボスキャラクターであるジムリーダーを3人倒すまで進めることができたという。
さらに、拡張思考モードの活用により、数学の難問への正答率が飛躍的に向上することも確認された。並列処理を用いたテストでは、複数の異なる思考プロセスを並行して走らせ、最適な回答を選ぶことで、科学分野の質問に対する正答率が大幅に向上したという。
安全性に関しては、Anthropicの専門チームがモデルのリスク評価を実施し、Claude 3.7 Sonnetは既存の「AI安全レベル2(ASL-2)」の基準を満たしていると判断された。特に、危険な情報の提供を防ぐための監視システムや、悪意ある攻撃(プロンプトインジェクション)への耐性向上が図られている。Claudeの可視化された思考プロセスにおいても、一部のセンシティブな内容は暗号化され、ユーザーには表示されない仕組みが採用されている。
Claude 3.7 Sonnetは、現在Claude.aiやAPI経由で利用可能だ。








