マイクロソフト、「1bit LLM」に関する論文「The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits」を公開(2月27日)
月末になってやってきた驚きのニュース。記事を執筆している段階ではASCII.jp上に詳しい記事はないが、とりあえず論文へのリンクを示しておく。
https://arxiv.org/abs/2402.17764
この技術は、LLMのパラメータを「0」「1」「-1」で表すことで、計算を簡略化する技術。1ビット量子化、とされているが3値なので「約1.58ビット」だ。
結果として、演算自体は行列の「足し算」となる。従来は行列の「掛け算」だったので、処理負荷が劇的に減る。これで従来(一般的には16ビットもしくは32ビットでの処理)との間で、言語モデルとしての性能が変わらないのだとすれば、確かに画期的な技術だ。
筆者は論文をちょっと読んだだけであり、他の方が検証したものを眺めている状況だ。だから価値についてなにかを断言するのは難しい。ただどうやら、「条件はあるし制約もあるが、一定の範囲では有効」という意見が多いようだ。大型のモデルよりも小型のモデルで有効、との分析も目にする。
現在の生成AIをめぐる課題のほとんどは、演算負荷に起因する。コストが高いゆえに用途が限られるのも、大手企業が有利であるのも、試行錯誤もしづらいのも、演算負荷が高いから。これが変わるなら、状況は激変する。
ただ、すべてのシーン、すべての規模のモデルでこの論文の内容が有効かは、まだわからない。「GPUが不要になる」という言説も見えるが、実際にはGPUを使えばさらに速くなるので、GPUが有利であることに変わりはない。「GPUをさらに活かせる」もしくは「GPUに頼らなくていい用途も出てくる」と考えるべきだろう。
しばらく動向を見守るべき技術だ。マイクロソフト自体の戦略にも影響を与えることだろう。
この連載の記事
-
最終回
AI
“生成AI元年”が終わり、ビジネスへの実装段階になってきた -
第11回
AI
マイクロソフト30年ぶりのキー追加は“生成AI推し”の象徴だ -
第10回
AI
2023年は“生成AIの年”だった|AIニュースまとめ -
第9回
AI
OpenAIはどこへ行くのか|AIニュースまとめ -
第8回
AI
アップル新型「MacBook Pro」生成AIを意識したスペックに|AIニュースまとめて解説 -
第7回
AI
Adobeやグーグル、AIの売り込み進める|AIニュースまとめて解説 -
第6回
AI
「今動かなければ遅れる」生成AI開発を猛烈に進める、アメリカIT大手の危機感|AIニュースまとめて解説 -
第5回
AI
AIの「政治・地政学リスク」が鮮明になってきた|AIニュースまとめて解説 -
第4回
AI
グーグル、生成AI“有料展開”急ぐ 運用コスト重く|AIニュースまとめて解説 -
第3回
AI
楽天、ソフトバンクの“生成AI戦略”に注目【AIニュースまとめて解説】 - この連載の一覧へ