ついに「GPT-4」を超えた　Anthropic「Claude 3」

2024年03月05日 17時45分更新

文● 田口和裕

　Anthropicは3月4日、同社の大規模言語モデル（LLM）「Claude」の最新版となる「Claude 3」ファミリーを発表。チャット型AI「claude.ai」およびAPIで使用できる。

3つのモデルを用意

縦軸が賢さ、横軸がコスト

　Claude 3には「Claude 3 Haiku（以下Haiku）」「Claude 3 Sonnet（以下Sonnet）」「Claude 3 Opus（以下Opus）」の3つのモデルが用意されている。

　Haikuはコストと反応速度に特化した、ファミリーで最もコンパクトなモデル。シンプルなインプットに対してこれまでにない速度で回答するという。同時翻訳など速度が重要な用途に向いているほか、ランニングコストもサイズもファミリーで最も小さいため比較的小規模なプロジェクトに向いている。

　APIで使用する際の価格は100万トークンごとに入力が0.25米ドル（およそ38円）、出力が1.25米ドル（およそ188円）となっている。

　Sonnetは、能力と速度の理想的なバランスを目指したモデル。同等のモデルと比較して低コストで強力なパフォーマンスを発揮するとしている。主にデータ処理やマーケティング、品質管理といった企業向けソリューションでの利用が想定されている。

　価格は100万トークンごとに入力が3米ドル（およそ452円）、出力が15米ドル（およそ2258円）となっている。

　Opusは最も知能が高く、複雑なタスクでも市場最高のパフォーマンスを発揮するとのこと。APIやデータベースを介した複雑なアクションの計画と実行、インタラクティブなコーディング、創薬、チャートとグラフの高度な分析、財務と市場動向予測といった高度な活用を想定している。

　価格は100万トークンごとに入力が15米ドル（およそ2258円）、出力が75米ドル（およそ1万1287円）となっている。

　ちなみにOpenAIのGPT-4をAPI経由で利用すると100万トークンごとに8Kモデルで入力が30米ドル（およそ4514円）、出力が60米ドル（およそ9028円）、32Kモデルで入力が60米ドル（およそ9028円）、出力が120米ドル（およそ1万8055円）となっている。

　3モデルとも20万トークンのコンテキストウィンドウが提供されるが、実験ではどのモデルも100万トークンを超える入力が可能になっているため、必要に応じ拡大される可能性があるという。

　OpusおよびSonnetは現在159カ国で利用可能になったClaude APIで3月4日より、Haikuは間もなく利用可能になる。

　また、チャット型AI「claude.ai」では無料でSonnetを利用できるほか、有料の「Claude Pro」サブスクライバーにはOpusも公開される。

　さらに、3月4日からAmazon BedrockおよびGoogle CloudのVertex AI Model GardenのプライベートプレビューでもSonnetが利用可能。OpusとHaikuも間もなく登場予定だという。

　なお、現状claude.aiにはアクセスが集中しているようで、有料版への登録を促すメッセージが度々表示される状態になっている。

　今後も数ヵ月にわたり、関数呼び出し機能、対話型コーディング（REPL）、エージェント機能など主に企業ユースに向けた頻繁なアップデートがリリースされる予定。

ベンチマークでも好成績

　上図は複数のAI向けベンチマークによるClaude 3および競合他社モデルとの比較だ。

　最も知能が高いOpusは、大学レベルの専門知識（MMLU）、大学院レベルの専門的推論（GPQA）、基本数学（GSM8K）など、ほぼすべてのタスクにおいてOpenAIの「GPT-4」やグーグルの「Gemini Ultra」といった競合他社のフラッグシップモデルよりも高い数値を記録している。

　また、すべてのモデルにおいて、分析と予測、微妙なコンテンツ作成、コード生成、スペイン語、日本語、フランス語などの非英語言語での会話能力が向上しているという。

　視覚能力も高く、写真、表、グラフ、PDF書類、技術図面など幅広いマテリアルの認識能力も向上している。ベンチマークでは多くの項目でGPT-4より高い性能を見せているが、Gemini Ultraには負けている項目も多い。

応答速度など基礎性能も向上

　応答速度も向上しており、ライブカスタマーチャット、オートコンプリート、データ抽出タスクなど即応性が要求されるタスクでも活用可能だという。

　特に最も早いHaikuは、チャートやグラフを含む情報とデータが密集したarXivの研究論文（約1万トークン）を3秒未満で読み取ることができるという。

　また、Sonnetは大多数のタスクにおいてClaude 2やClaude 2.1よりも2倍高速化されており、Opusは速度は多少落ちるもののはるかに高いレベルの知能を持っているとする。

微妙な質問に対し回答を拒否する割合

　また、Claudeの前バージョンでは文脈理解が足りず質問に対して回答を拒否することが多かったが、今回のモデルではガードレールに近いプロンプトに対して回答を拒否する可能性が低くなっている。

　AnthropicはClaude 3ファミリーの性能はもちろん信頼性も重視しており、偽情報、CSAM（子どもの性的搾取材料）、生物学的濫用、選挙干渉、自律的複製スキルといった広範囲にわたるリスクを追跡・軽減するために専門チームを複数設置しているという。

　さらに、「Constitutional AI」の理念に沿ったモデルの安全性と透明性を向上させるため、画像認識などで予想されるプライバシーの問題を軽減するモデルを調整中だという。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2024年04月29日

AI

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ
2024年04月15日

AI

画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも
2024年04月08日

AI

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」
2024年04月05日

AI

AI検索「Perplexity」がかなり便利だったので紹介します
2024年04月08日

AI

3Dアニメーション技術の革新が止まらない
2024年04月24日

AI

マイクロソフト最新SLM「Phi-3」　メタ「Llama 3」あっさり抜く
2024年03月13日

AI

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」
2024年04月22日

AI

日本語対応の画像生成AI、東京発のSakana AIが発表　既存モデルより10倍高速
2024年04月12日

AI

ChatGPT、有料版で「GPT-4 Turbo」が利用可能に。LLM評価ツールも無償提供
2024年03月22日

AI

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ

ピックアップ

sponsored
有線/2.4GHz/Bluetoothを選べるトリプルモード接続＆クリック音アリナシも選択可能

我が家の「深夜うるさい問題」を解決する静音ワイヤレスゲーミングマウス「ED-G3MPRO」
sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
購入しやすい価格ながら機能充実、バッテリー長持ちの人気製品

1万円以下ウェアラブルの大定番がさらに進化！睡眠モニタリング精度アップの「HUAWEI Band 9」レビュー
sponsored
eスポーツ大会で採用される24インチクラスの新モデル

180Hzで3万円切りの即買いモデル、スピーカー内蔵のゲーミングディスプレー「G255PF E2」レビュー
sponsored
新たな敵は地中から現れる！

さらなる刺客（シカク）が四角い地球を襲う！5月23日発売『デジボク地球防衛軍２（略）』の魅力をチェック
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか
sponsored
大阪・泉州産のスウェット生地を採用した「AKRacing by BEAMS DESIGN モデル」

スウェット生地のチェアってどう？編集部員何人かに座った感想を聞いてみた
sponsored
セブンアールジャパンの西川氏とASRockの原口氏にコダワリを聞いてきた

パソコンショップSEVENとASRockのコダワリが炸裂！ Threadripper PRO 7995WX搭載BTOPC
sponsored
従来よりもさらにコスパよくゲーミングPCを組みたい方へ

ゲーミングマザーボード「GAMING PLUS」シリーズ完全解説＆自作のオススメ構成例も紹介
sponsored

BaaS普及を追求し続けるGMOあおぞらネット銀行と、ARIのAWS導入支援cnarisに迫る
sponsored
強化ガラス製マウスパッド「ROG Moonstone」など気になるデバイスもまとめて試す！

静音性重視の独自スイッチ“ROG NX Snow”がイイ！「ROG Strix Scope II 96 Wireless」をレビュー

ASCII.jp

AI

ついに「GPT-4」を超えた　Anthropic「Claude 3」

3つのモデルを用意

ベンチマークでも好成績

応答速度など基礎性能も向上

AI
日本発の画像生成AIサービスがすごい　無料アップスケーラー「カクダイV1」

AI
ChatGPTとClaudeの違いは? チャットAI比較対決

AI
ChatGPTよりすごい!? 15万語に対応　Claude 2.1登場

AI
Anthropic、軽量かつ高速なLLM「Claude 3 Haiku」の提供を開始

AI
対話型AI「Claude」、無料iOSアプリと30ドルのTeamプラン発表

AIオススメ記事

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ

画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

AI検索「Perplexity」がかなり便利だったので紹介します

3Dアニメーション技術の革新が止まらない

マイクロソフト最新SLM「Phi-3」　メタ「Llama 3」あっさり抜く

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」

日本語対応の画像生成AI、東京発のSakana AIが発表　既存モデルより10倍高速

ChatGPT、有料版で「GPT-4 Turbo」が利用可能に。LLM評価ツールも無償提供

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ

ピックアップ

我が家の「深夜うるさい問題」を解決する静音ワイヤレスゲーミングマウス「ED-G3MPRO」

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》

1万円以下ウェアラブルの大定番がさらに進化！睡眠モニタリング精度アップの「HUAWEI Band 9」レビュー

180Hzで3万円切りの即買いモデル、スピーカー内蔵のゲーミングディスプレー「G255PF E2」レビュー

さらなる刺客（シカク）が四角い地球を襲う！5月23日発売『デジボク地球防衛軍２（略）』の魅力をチェック

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか

スウェット生地のチェアってどう？編集部員何人かに座った感想を聞いてみた

パソコンショップSEVENとASRockのコダワリが炸裂！ Threadripper PRO 7995WX搭載BTOPC

ゲーミングマザーボード「GAMING PLUS」シリーズ完全解説＆自作のオススメ構成例も紹介

BaaS普及を追求し続けるGMOあおぞらネット銀行と、ARIのAWS導入支援cnarisに迫る

静音性重視の独自スイッチ“ROG NX Snow”がイイ！「ROG Strix Scope II 96 Wireless」をレビュー

ついに「GPT-4」を超えた Anthropic「Claude 3」

3つのモデルを用意

ベンチマークでも好成績

応答速度など基礎性能も向上

この記事の編集者は以下の記事をオススメしています

AI 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」

AI ChatGPTとClaudeの違いは? チャットAI比較対決

AI ChatGPTよりすごい!? 15万語に対応 Claude 2.1登場

AI Anthropic、軽量かつ高速なLLM「Claude 3 Haiku」の提供を開始

AI 対話型AI「Claude」、無料iOSアプリと30ドルのTeamプラン発表

AIオススメ記事

ピックアップ

ついに「GPT-4」を超えた　Anthropic「Claude 3」

AI
日本発の画像生成AIサービスがすごい　無料アップスケーラー「カクダイV1」

AI
ChatGPTとClaudeの違いは? チャットAI比較対決

AI
ChatGPTよりすごい!? 15万語に対応　Claude 2.1登場

AI
Anthropic、軽量かつ高速なLLM「Claude 3 Haiku」の提供を開始

AI
対話型AI「Claude」、無料iOSアプリと30ドルのTeamプラン発表