サイバーエージェントは5月17日、最大68億パラメーターの日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことを発表した。
同社は日本語LLMの開発に取り組んでおり、今回、一部モデルをHugging Face Hubにて公開した。公開されたモデルは、WikipediaおよびCommon Crawlのオープンな日本語データで学習したもので、商用利用可能なCC BY-SA 4.0ライセンスで提供される。なお、本モデルは日本国内における現行の公開モデルにおいて最大級の規模としている(5月17日時点)。本モデルをベースとしてチューニングを行なうことにより、対話型AIなどの開発も可能になるという。
同社は、これまで培った知見を活かしチャットボットやRPAをはじめとする業界特化型のLLMの構築や、各企業と連携したLLMを活用したビジネス開発の推進等を予定している。また、LLMを活用したビジネス開発に携わるエンジニアの新規採用を実施し、体制を強化していくという。