このページの本文へ

Anthropic、無料で使える「GPT-4o」超えのAIモデル「Claude 3.5 Sonnet」

2024年06月21日 11時45分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

 Anthropicは6月21日、同社の開発する大規模言語モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」を発表。旧来の上位モデル「Claude 3 Opus」やOpenAIの「GPT-4o」を上回る性能でありながら、中位モデルである「Claude 3 Sonnet」と同等のスピードとコストを実現するという。

「Claude.ai」で無料で使える

 「Claude 3.5 Sonnet」は同社が提供するAIチャットサービス「Claude.ai」およびiOS版「Claude」アプリで無料(利用制限あり)で利用できる。有料プランのユーザーは無料ユーザーと比べて利用制限が大幅に緩和される。

 また、「Anthropic API」「Amazon Bedrock」「Google CloudのVertex AI」などの環境でも利用可能。価格は、入力トークン100万件あたり3ドル、出力トークン100万件あたり15ドルで、20万トークンの長大なコンテキストウィンドウを持つ。

 今年後半には軽量な「Claude 3.5 Haiku」と最高性能の「Claude 3.5 Opus」もリリースされる予定。後者は恐らく有料プランのユーザーのみ利用可能となるだろう。

高速にも関わらずSOAを実現

 同モデルは同社のこれまでのフラッグシップモデル「Claude 3 Opus」の2倍の速度で動作するにも関わらず、LLMを評価する各種ベンチマークでも好成績を達成。特に大学院レベルの推論能力(GPQA)、学部レベルの知識(MMLU)、およびコーディング能力(HumanEval)において業界最高性能を発揮した。

 特に、ニュアンス、ユーモアといった感情に基づく複雑な指示の理解が向上しており、自然で共感しやすい調子の高品質なコンテンツが生成されるという。

 コーディング能力も大幅に向上している。Anthropicが開発したオープンソースのコードベースにバグを修正したり機能を追加したりする能力を評価するツールによるとClaude 3 Opusの問題解決率が38%のところ、Claude 3.5 Sonnetは問題の64%を解決できたという。

 つまり、適切な指示と関連ツールがあれば、Claude 3.5 Sonnetは高度な推論とトラブルシューティング能力でコードを書き、編集し、実行することができるのだ。

 また、コードの翻訳も可能なので、レガシーアプリケーションの更新やコードベースの移行時にも有用だ。

画像認識能力が大幅に向上

 画像認識能力も強化されており、Claude 3.5 Sonnetは各種視覚ベンチマークにおいてClaude 3 Opusや競合モデルを上回っている。

 テキストプロンプトだけではなく、グラフや図表、印刷されたテキストの読み取りなど視覚的推論を必要とするタスクの能力も向上している。

 デモ動画ではグラフや図版をアップロードし、そこから読み取れるデータをJSONフォーマットで構造化し、そのデータを与えられたカラーパレットとJavaScriptのライブラリーを使って新たなグラフとして描画、最終的にはプレゼンテーション(PPTではなくJSベース)を作成するという離れ業を見せている。

 さらに目玉機能として、ユーザーがClaudeとやり取りしながらコンテンツを作成できる新機能「Artifacts」も実装された。

 デモ動画では「8ビットスタイルのカニを描いて」というリクエストを元に、ユーザーとClaudeがやり取りしながらアニメーションを作成する様子を見ることができる。

安全性とプライバシーへのコミットメント

 Anthropicは安全性と透明性へのコミットメントの一環として、Claude 3.5 Sonnetを英国人工知能安全研究所(UK AISI)に提供し、展開前の安全性評価を受け、その結果は米国人工知能安全研究所(US AISI)と共有されているという。

 Anthropicはユーザーから明示的な許可を得ない限り、これまでもこれからもユーザーが提出したデータを生成モデルの訓練に使用することはないと断言している。

カテゴリートップへ

ピックアップ