このページの本文へ

東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表

2024年03月13日 12時40分更新

文● 田口和裕

　東京大学松尾研究室発のAIベンチャー「ELYZA」は3月13日、700億パラメーターの最新日本語大規模言語モデル（LLM）「ELYZA-japanese-Llama-2-70b」を発表した。

100Bトークンの日本語コーパスで追加事前学習

「ELYZA」デモサイト

　同モデルは英語の言語能力に優れたメタのLLM「Llama 2」シリーズに日本語能力を拡張するプロジェクトの一環で得られた成果物だ。

　具体的にはLlama 2に対し、日本語による追加事前学習と事後学習を実施。追加事前学習には約100Bトークンの日本語コーパスを用い、事後学習には「日本語での指示追従能力と一般的な知識を向上させることを目的としてELYZAが独自に構築した高品質なデータセット」を用いているという。

　モデルの学習には「GPT-4」や「GPT-3.5 Turbo」など、規約において出力を他モデルの学習に利用することが禁止されているモデルの出力は一切含まれていないという。

　なお、これまでのようなオープンソースでの公開ではなく、同モデルを含むELYZAの日本語LLM群を「ELYZA LLM for JP」シリーズとし、2024年春以降API提供という形で（恐らく）有償公開ということになるだろう。

日本語LLMでは最高峰の性能

Tasks 100による人手評価（国内モデルとの比較）

　LLMの指示に従う能力や、ユーザーの役に立つ回答を返す能力を測ることを目的とした日本語ベンチマーク「Tasks 100」による評価では、同じくメタの「Llama 2 70B」をベースとする他の日本語 LLM国内モデルの中で1位となっている。

Tasks 100による人手評価（グローバルモデルとの比較）

　さらに、「Claude Instant」や「GPT-3.5 Turbo (1106)」といった海外のモデルを上回り、その他のグローバルモデルとも遜色ないスコアを獲得した。

Japanese MT-Benchによる性能評価

　Stability AIが提供するLLMの対話性能を測るためのベンチマーク「MT-Bench」を日本語訳して作られた「Japanese MT-Bench」による性能評価では、グーグルの「Gemini 1.0 Pro」や「GPT-3.5 Turbo」を総合スコア（平均）で上回っているほか、「stem」など一部のカテゴリーでは「GPT-4」を上回る数値さえ見せている。

　ELYZAは今後も日本語LLMの研究開発を進め、より高性能な日本語LLMの実現に向けて投資を続けていくという。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2024年12月09日

AI

画像生成AIの進化が早すぎる　2024年に起きたことまとめ
2024年12月09日

AI

人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク　初心者にオススメ
2024年12月24日

AI

動画生成AI、無料プランでも使い倒せば月200本作れます　サービス同士の違いも比較しました→Runway、Pika、Hailuo、Kling、Luma、Kaiber、PixVerse
2024年12月09日

AI

AI、人間超えた説　OpenAIの従業員が「AGIを達成した」との見方示す
2024年12月10日

AI

【速攻解説】OpenAI「Sora」の使い方　月額3000円で出来ること、出来ないこと
2024年12月02日

AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃
2024年12月23日

AI

OpenAI「Sora」残念な離陸　中国勢が飛躍する動画生成AI
2024年12月09日

AI

X、AI「Grok」無料で試せるように　写真みたいな画像も生成できる
2024年10月21日

AI

もはや実写と間違えるレベル　動画生成AI「Runway」の進化がすごい
2024年11月25日

sponsored

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ

ピックアップ

sponsored
MSI「MAG X870 TOMAHAWK WIFI」レビュー

Ryzen 7 9800X3Dで高性能ゲーミングPCを組みたいならX870マザーボードは耐久性能と程よい価格で選べば間違いなし
sponsored
店舗スタッフが自作パソコン完成まで徹底サポート

業界最安値級から2万円引き!? 普通に買うよりお得・手ブラでPCが組めるアプライドの自作イベント
sponsored
2004年から業界をリード！マウスコンピューターのゲーミングPCブランド「G TUNE」が20周年を迎えた

【今売れているゲーミングPCのスペックはコレ！】「G TUNE」で見る最新ゲーミングPCの最先端
sponsored
JN-IPS27G200F-PPをレビュー

約2.6万円のパープル200Hzゲーミングディスプレー、女性的にはアリ？盲牌でわかるボタンとは？
sponsored

黒くてデカいデスクトップパソコンは不要！在宅ワークこそエレガントに効率アップを狙える「Lenovo IdeaCentre Tower 14IRR9」だ
sponsored

いまゲーミングノートを選ぶなら“薄軽”が必須条件、Ryzen AI 9とRTX 4060搭載の最新「ROG Zephyrus G16」
sponsored
「HUAWEI WATCH GT 5 Pro」に無料アップデートで新機能！「HUAWEI WATCH D2」にも搭載！

より幅広い健康管理が実現！ファーウェイ製スマートウォッチに無料で加わる心電図（ECG）測定機能を試す
sponsored
CORSAIR「iCUE LINK TITAN RX RGB」をチェック

iCUE LINKで面倒な取り付けやRGB設定が超簡単、冷却性能もバッチリ高いCPUクーラーが3万円強！
sponsored
ASUSの新ケース「TUF Gaming GT502 Horizon」にCore Ultra 9 285Kを採用

あれもこれもASUS！新ピラーレスケースも渋カッコいいBTOPCのコダワリを聞く
sponsored
基調講演には総務省 CISOの山内智生氏が登壇、サイバー空間をめぐる脅威動向や政策を紹介

ランサム感染の実体験からMDR導入事例までが語られた「Canon Security Days 2024」
sponsored
「LEVEL-15FXA61-R7-RM4X」を試す、重さは2.26kg、144Hzにも対応

実家・ホテル・コタツでゲームしたいなら、Ryzen 7とRTX 4060のLEVEL∞15.6型ノートPC
sponsored
180Hz駆動でGTG0.5msのRAPID VAパネルを搭載、MSI「MAG 325CQRF QD E2」

ゲームの世界にいるみたい！没入プレイしたいなら大画面の湾曲ゲーミングディスプレーがおすすめ
sponsored
“ツールを入れただけ”じゃ、プロジェクト・タスク管理は回らない！

Backlogの利用をチーム内で定着させたい？初歩のノウハウをまとめます
sponsored
セキュリティログの分析／可視化「FortiAnalyzer」と、高度なAIアシスタント「FortiAI」

“アラート疲れ”で担当者がサイバー攻撃を見落とす！どうやったら防げた？
sponsored

狭い机でも縦置き／横置きどちらもOK！高性能な小型デスクトップパソコンでノートPC以上の作業効率アップを狙う
sponsored
ファーウェイ製スマートウォッチは、家族や知人、自分（!?）へのプレゼントにもピッタリ！

バッテリー長持ちのスマートウォッチで2025年こそ健康的な生活！クリスマスプレゼントに合う製品を紹介！
sponsored
JAPANNEXTの「JN-IB375C144UQR-H」をレビュー

144Hzで21：9の3840×1600ドット37.5型ウルトラワイドディスプレー、ゲームの没入感や仕事の効率アップがスゴイ
sponsored
ポータブルゲーミングスピーカー「TQ-PG300」

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！