このページの本文へ

田口和裕の「ChatGPTの使い方!」 第42回

ChatGPT、Gemini、Claude、Grokの違いを徹底解説!仕事で役立つ最強の“AI使い分け術”【2025年12月最新版】

2025年12月03日 13時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

Anthropic「Claude Opus 4.5」──"確実性"とPC操作を極めた仕事用AI

Computer Use(PC操作)

 ClaudeはPC画面を見てカーソルを動かし、クリックし、入力まで代行する。Excelの集計内容をWeb管理画面に転記する、複数のシステムをまたぐデータ収集、ブラウザでの情報検索と整理といった定型作業を丸投げできる。Opus 4.5では新たに「ズーム機能」が追加され、画面の特定領域を拡大して細かいUI要素を正確に認識できるようになった。これにより、小さなボタンや入力欄の操作精度が向上している。

コーディング性能と効率化パラメータ

 SWE-bench Verifiedで80.9%を記録し、実際のGitHub issueを解決する能力では現時点で最高スコアを達成した。特筆すべきは新しい「Effortパラメータ(effort parameter)」で、High(高)、Medium(中)、Low(低)の3段階で計算リソースの割り当てを調整できる。Mediumに設定すると、Sonnet 4.5の最高性能と同等の結果を76%少ないトークンで達成し、Highではさらに4.3ポイント上回りながら48%少ないトークンで済む。つまり同じ品質をより安く、または同じコストでより高品質な結果が得られる。価格は$5/$25(入力/出力100万トークンあたり)で、前世代Opus 4.1の$15/$75から大幅に値下げされた。

長時間稼働を支える新機能

 長時間動作するエージェントのために、いくつかの実用的な機能が追加された。「コンテキスト圧縮(context compaction)」は会話が長くなると古い部分を自動で要約し、重要な情報だけを保持する。「Tool Search」は必要なツールだけを動的に読み込む仕組みで、50個のツール定義を事前にロードする場合と比べてコンテキストの使用量を85%削減できる。さらに「プログラマティック・ツール・コーリング(programmatic tool calling)」により、Pythonコードでツールを直接実行できるようになり、トークン使用量を約37%削減する。これらの機能により、数時間〜数日にわたる複雑な作業でも安定して動作する。

利用制限の現実

 最上位モデルの利用制限(キャップ)は、従来のSonnetと同程度まで緩和されたものの、依然として存在する。複雑な作業を連続して実行するとすぐ制限に達するため、筆者としては本領を発揮し切れないもどかしさが残る。ただし価格が3分の1になったことで、API経由での利用はかなり現実的になった。

 なおClaudeは画像認識可能だが、画像生成は不可。ここが他3社とは明確に異なるポイントだ。

カテゴリートップへ

この連載の記事
ピックアップ