本命は、数週間先にやってくる。
Anthropicは5月28日、新AIモデル「Claude Opus 4.8」を公開。あわせて、「Mythosクラス」の強力なモデルを、今後数週間で全顧客に提供できる見通しを示した。Mythosは現在、一部組織がサイバーセキュリティ用途で使っているプレビュー段階にある。
Mythosは、Opusよりさらに高い知能を持つ新しいクラスのモデルとして位置づけられる。Anthropicは、こうした能力レベルのモデルを一般提供するには、危険な出力を検知しブロックするためのセーフガードが必要だとしている。安全装置が追いつくまで慎重に開放している段階だ。
Opus 4.8は、コーディング、エージェント作業、推論、知識作業の各ベンチマークで前世代から改善した。価格はOpus 4.7と同じで、通常利用は入力100万トークンあたり5ドル、出力100万トークンあたり25ドル。開発者はClaude APIで「claude-opus-4-8」を利用できる。
Opus 4.8の進化点は“うそをつきにくい、誠実さ”だ。AIモデルは、根拠が薄いのに自信ありげに進捗や結論を語ることがある。Opus 4.8は、作業上の不確実性を示しやすく、書いたコードの欠陥を見逃したままにする確率が前世代より約4分の1になったという。
また、AIコーディングツールのClaude Codeには「dynamic workflows」が研究プレビューとして入った。Claudeが作業を計画し、1つのセッションで数百の並列サブエージェントを走らせ、結果を検証してから返す仕組み。Anthropicは、数十万行規模のコードベース移行をキックオフからマージまで進められる例を挙げている。
Mythosは脆弱性の発見について驚異的な性能を見せたことで注目された。日本政府と金融機関はMythosのアクセス権取得に向けて動いており、三菱UFJ、三井住友、みずほの3メガバンクが5月中にも利用を始める見込みだ。数週間後の一般提供によって、“神話級”モデルの性能の一端が、いよいよ表舞台にあらわれることになる。
本記事はアフィリエイトプログラムによる収益を得ている場合があります







