メタは7月23日、最新の大規模言語モデル「Llama 3.1」を発表した。GitHubを通じてオープンソースで公開されるほか、AWS、Azureといったサードパーティープラットフォームでも利用可能。
最大4050億パラメーター
Starting today, open source is leading the way. Introducing Llama 3.1: Our most capable models yet.
— AI at Meta (@AIatMeta) July 23, 2024
Today we’re releasing a collection of new Llama 3.1 models including our long awaited 405B. These models deliver improved reasoning capabilities, a larger 128K token context… pic.twitter.com/1iKpBJuReD
Llama 3.1は、メタが推進するオープンソースAI戦略の最新版だ。8B(80億)、70B(700億)、405B(4050億)パラメーターの3つのサイズがラインアップされており、独自の「Llama 3.1 Community License」の下で公開される。これにより、研究者や開発者が自由にアクセス・カスタマイズすることが可能になる。
残念ながら日本語は未対応
約15兆トークンのテキストデータで学習し、科学、歴史、文化など多岐にわたる話題に対応できる幅広い知識を獲得している。
最大12万8000トークン(128K)の長大な文脈を理解できるのも強み。これにより、長い論文や複雑な会話などの文脈を正確に把握し、適切な応答を生成できる。
推論能力も向上しており、複雑なプログラミング、数学的問題、多段階の思考を要する課題に対応できるという。
また、外部の情報源やツールを自動的に活用する能力も備えており、最新のニュースを検索して回答に反映したり、計算ツールを使って複雑な数式を解いたりすることで、より正確で幅広い情報提供が可能だ。
さらに、豊富な知識を活用して、医療や法律など特定分野に特化したAIアシスタントを、少ないデータと計算資源で効率的に開発できるようになるという。
現在のところ英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語の8言語に対応している。
残念ながら日本語には対応していない。プロンプトの末尾に「lang:ja」を加えると日本語も通るという報告もあったが、現状日本語能力はあまり高くないようだ。
安全性と倫理面への配慮も重視されている。有害なコンテンツの生成を防ぐ仕組みや、プライバシー保護機能が組み込まれている。
画像認識や音声理解などのマルチモーダル機能の開発も進めており、将来的にはテキスト以外の入力にも対応する総合的なAIモデルを目指しているという。
多くの指標でGPT-4を上回る成績
ベンチマークテストでは、Llama 3.1 405Bモデルが多くの分野で最先端の非公開モデルと同等以上の性能を示している。
一般的な言語理解を測るMMULでは88.6点を記録し、GPT-4の85.4点を上回った。数学的推論を評価するGSM8Kでは96.8点と、他のモデルを凌駕している。また、長文理解を測るZeroSCROLLS/QuALITYでは95.2点を獲得し、GPT-4と同等の成績を残した。
特筆すべきは多言語タスクでの性能だ。Multilingual MGSMでは91.6点を記録し、GPT-4やGPT-4 Omniを上回る結果となった。コーディング能力を測るHumanEvalでも89.0点と高得点を記録し、GPT-4に迫る性能を示している。
一方で、推論能力を測るGPQAでは51.1点と、他のモデルに及ばない結果となった。しかし、全体としてLlama 3.1 405Bは、多くのベンチマークで非公開モデルと互角以上の性能を発揮していると言えるだろう。
手軽に試すならPerplexity Proで
Llama 3.1の利用方法は複数用意されている。開発者や研究者向けには、GitHubを通じてオープンソースで公開されているので、ダウンロードして独自の環境で利用できる。
さらに、「AWS」や「Microsoft Azure」、「Google Cloud」、「Snowflake」など25以上のクラウドサービスプロバイダーがLlama 3.1のサポートを発表しており、これらのプラットフォーム上で簡単に導入・利用することが可能だ。
例えば、AWSでは「SageMaker」を通じて、Azureでは「Azure AI Studio」を通じてLlama 3.1を利用できる。
なお、オープンソースモデルとしての利用は無料だが、クラウドサービス上での利用には各プロバイダーの料金体系が適用される。
一般ユーザー向けには、Llama 3.1を基盤としたAIアシスタント「Meta AI」として一部の国・地域で提供される。このMeta AIは、「WhatsApp」「Instagram」「Messenger」などのメタ社のアプリ内で利用可能な対話型AIサービスだが、日本での提供時期は現時点では未定となっている。
なお、LLMを活用した検索エンジン「Perplexity.pro(有料プラン)」では、さっそく「Llama 3.1 405B」が利用可能になっていた。いち早く試してみたい方はそちらでどうぞ。