7月18日、メタは最新のオープンソース大規模言語モデル「LLaMA2」をリリースしたが、早くもこのモデルを使ったチャットボットプログラムが公開された。
「LLaMA2」公開からわずか数時間で完成
✨NEW LAUNCH! LLaMA2 chat API & open-source playground💫:
— Marco Mascorro (@Mascobot) July 18, 2023
We're releasing tools that make it easy to test @meta's latest LLM & add it to your own app with @replicatehq.
Playground: https://t.co/YRxDyl5fVW
Live chat API here: https://t.co/TFUOsy44oT
Repos & instructions below:
「llama2.ai」と名付けられたデモサイトでは、ChatGPTと同じようにチャット形式で「LLaMA2」の能力をいち早く試すことができる。
パラメーター数700億の「LLaMA2-70B」、130億の「LLaMA2-13B」、70億の「LLaMA2-7B」の3モデルを選択して利用可能。
その下には、出力のランダム性をコントロールする「Temprature」、単語選択の多様性をコントロールする「Top P」、文章の最大長を決める「Max Sequence Length」3つのパラメーターが用意されている。
If you want to just play with the model, https://t.co/YRxDyl5fVW is a very easy way to do it. So far, we’ve found the performance is similar to GPT-3.5 with far fewer parameters.
— Marco Mascorro (@Mascobot) July 18, 2023
実装を手掛けたMarco Mascorro氏は、「これまでのところ、OpenAIの「GPT-3.5」よりはるかに少ないパラメーターで同様のパフォーマンスが得られることが分かっている」とツイートしている。実際試してみたところ、多少レスポンスは遅いながらも問題なく利用できた。
日本語はあまり得意ではない様子
ただし、日本語で質問してみたところ、一応対応はできるもののChatGPTほどの知性は感じられなかった。
メタの論文によると、「LLaMA2」の学習データに含まれる日本語テキストの割合はわずか0.1%なので致し方ないところだろうか。
オープンソースならではのスピード感
なお、プログラムはすべてGitHubで公開されており、誰でもすぐに「LLaMA2」を使ったチャットボットを実装することができる。さらに、機械学習モデルをパッケージ化するプログラム「Cog」を使って独自のLlaMA 2をデプロイできるプログラムも公開されている。
LlaMA 2の公開からわずか数日、世界中のエンジニアがすごいスピードで実証をスタートしており、早くもオープンソースのメリットが現れ始めている。