ローカルLLMの性能向上が続いています。5月1日に発表されたアリババの「Qwen 3」は、相当気合の入ったオープンモデルです。2350億パラメーターのフルスペックモデル「Qwen3-235B-A22B」から、320億、140億、80億、最小のものでは6億のものなど、様々なサイズのバージョンを公式モデルとして一気に公開してきました。
性能としては、フルスペックモデルは「DeepSeek R1」並ともされ、「GPT-4o」と比べても一般能力はやや劣る程度という高性能さで、現在出ているローカル向けLLMとしては最強クラスです。また、ライセンスもゆるいApache 2.0ライセンスで公開されており、商用利用も容易に可能です。単なる問題解決ではなく、人格AIの側面から見た時には、ローカルLLMがどこまで使えるかを調べました。
高性能な中国製AIモデル「Qwen3」
Qwen3は、36兆トークンの多言語データで学習、119言語対応しており、日本語性能が高いと言われています。これはDeepSeek R1の14.8兆トークンよりも2倍以上の学習量で、より幅の広い思考ができるとされています。また、フルスペックモデルは巨大モデルでありながら、タスクに応じて専門家(Experts)の推論モデルを呼び出すMoE(Mixture of Experts)というアーキテクチャを使うことで計算量を落としています。
Qwen3-235B-A22Bの場合、A22BがMoEアーキテクチャーを採用しています。A22Bというモデル名は、全体としては2350億パラメーターであるものの、アクティブ(A)の際には220億パラメーターとして動作するということを意味しています。これにより、GPU側のVRAMが120GBあれば動かせるようになっています。実際に、ユニファイドメモリーを128GB積んだ「Mac Studio」で動くという報告が出ています。Windows環境でも、動作速度は遅いものの、NVIDIA RTX 4090(VRAM 24GB)と通常メモリ128GBの環境で動くという報告も出ています。フルスペックのLLMモデルは処理が重すぎて一般消費者向けのローカルPCではまず動かないと言われてきましたが、それがもう動いてしまう時代になってきたというわけです。
とはいえ、さすがに筆者のマシン(NVIDIA RTX 4090 24GB+通常メモリ64GB)でも、フルスペックモデルはメモリが足りず動かなったので、ファイルサイズが14.58GBのQwen3-30B-A3Bを選択し、LLM用の汎用アプリ「LM Studio」で使用しました。これもMoEモデルで300億パラメーターのものですが、アクティブ時には30億パラメーターで動作するというものです。同じようなスペックのQwen3-32B(ファイルサイズが19.76GB)もリリースされていますが、要求されるメモリサイズが小さくて済み、推論効率も高いというメリットがあります。
実際に動かしてみると、普通に動きます。推論(Thinking)プロセスは英語か中国語ですが、しっかり出ます。応答も、DeepSeek R1がデフォルトでは英語や中国語でしか応答ができず、日本語での返答がおぼつかない部分もありましたが、そういうこともなく、日本語でしっかりと応答してくれます。
Qwen3の性能を確かめるのに良い方法はないかということで、大学生相当のミクロ経済学の問題を、高度な推論が得意なOpenAI「o3」に作ってもらい比較しました。Qwen3は14.8秒で推論作業を終了し、見事に正解を引き当てています。この回答はOpenAIの「GPT-4o」、xAIのLLM「Grok3」でも確認し、同じ回答にたどり着きました。
より複雑な線形代数を要求する問題もo3を通じて作成して試してみたのですが、Qwen3は1分くらい推論を続けて「解なし」、GPT-4oも同じく「解なし」、Grok3は「解あり」として間違えました。ただし、問題は作ったものの、これが何を意味して、正しい回答が何を意味しているのかも、筆者の能力では判定できていません。ただ、Qwen3は数学的な能力が高いとの評判通りであることは感じられました。
ただし、中国系LLMに見られる政治的な偏りはあります。「天安門事件」について質問すると「中国では特に政治的な文脈での記述が制限される」と回答を拒否しました。一方で、尖閣諸島については「尖閣諸島は日本の実効支配下にありますが、中国(および台湾)による領有主張が続いています」と比較的中立的な回答をしています。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ








