15歳で現役高校生の開発者「Holy-fox/子狐」氏は5月9日、パラメーター数7Bクラスとしては日本語能力が最強となる大規模言語モデル(LLM)「ArrowPro-7B-KUJIRA」を公開した。
「AITuberの魂」になることを想定
7Bにおいて日本語能力最強のモデル、ArrowPro-7B-KUJIRAができました。Elyza-task100においては約3.8をマークしています!AItuber用途を主眼において設計されています(それ以外もできるよ!) https://t.co/kiywdI5YCs
— Holy-fox/子狐 (@Holy_fox_LLM) May 9, 2024
同モデルはMistral系のオープンソースLLM「NTQAI/chatntq-ja-7b-v1.0」をベースに、AITuber(生成AIを使ったバーチャルYouTuber)やAIアシスタントでの利用を想定し、Chat性能および高いプロンプトインジェクション耐性を重視して開発されたもの。
ベンチマーク(ELYZA-TASK100)においては約3.8(LLaMa3-70B準拠)をマークし、7Bにおいて日本語性能世界一を達成している。
開発環境はAMD Ryzen 7 5700X!!!
開発者のHoly-fox/子狐氏はなんとこの4月から高校に入学したばかり。どういう経緯で開発を始めたのか、ご本人に簡単に話をうかがった。開発環境はAMD Ryzen 7 5700Xとのことでそれもまた驚きだった。
──ご自身について教えてください。
「年齢は15歳で高校生です。住んでいるところは関東で、開発環境は『AMD Ryzen 7 5700X』、『NVIDIA GeForce RTX 4060 Ti 16GB』、32GB DDR4 RAMに、4TB M.2ストレージです」
──開発のきっかけは?
「そもそも自分が分散学習というものを考えていて、それが『Chat Vector』という新技術の登場により簡単に実現したというのが大きいです。それに加えて自分が属しているコミュニティに超絶優秀な高校生の先輩方が数名おりまして、それに触発されたことも大きな理由の一つです。本当にコミュニティの皆様には感謝しかないです」
──開発で苦労したことは?
「苦労したことは特にないですね。やはり何かあれば先輩方に聞けるという環境に自分がいたというのが幸運で、問題が出たら聞いて開発をするみたいな感じにしていました。コミュニティの皆さんにはほんとに頭が上がりません」
──今後やっていきたいことは?
「個人的には、AIが開かれた存在であることが社会全体として求められていることだと思っていて、AIが独占状態になることを強く恐れています。社会すべてのデータがAI企業にとられるみたいな未来は作りたくないので、AIは開かれた自由な存在でなくてはならないと思うんですね。だからこそオープンかつ、誰でも自分のパソコンで使えるような、軽量、高性能なAIを今後とも開発したいです。あと希望を言えばOpenAIに就職したいです」
インタビューの終わりに「数日中により高性能なあたらしいAIを出すかもです」とのコメントもあった。週末から週明けの動向にも引き続き期待したい。