Deepreneur、商用利用可能な日本語LLM「blue-lizard」を一般公開
東京大学松尾研究室発のAIスタートアップ「Deepreneur」は2月13日、商用利用可能な70億パラメーターの日本語LLM「blue-lizard」を開発し、一般公開した。
blue-lizardは、MetaのLlama-2-7bに対して、Wikipediaや書籍等の日本語の学習データを用いて追加事前学習と独自データによるファインチューニングを実施したモデル。
70億パラメーターと非常に軽量なモデルであるにも関わらず、JGLUE(日本語タスクにおける評価ベンチマーク)を用いた評価では、ChatGPT-3.5を超えるスコアが算出されているといい、公開されている日本語モデルの中では最高性能だという。
ライセンスは、LLAMA 2 Community License に準拠し、Acceptable Use Policyに従う限りにおいては、研究および商業目的での利用が可能。
同社は、クラウド型はもちろんのこと、従来は困難であったオンプレ型まで、各社の個別の課題・要件に沿った各社独自のLLMの構築から、導入まで一気通貫した支援を実施していくとする。