ローカル環境では最強クラスの高性能
さまざまなLLMを簡易に動作させるアプリ「LM Studio」を使ったところ、筆者のRTX 4090(VRAM 24GB)搭載PCでは、32Bならきびきびと動作しました。一方、70Bも動かないわけではありませんが、VRAMが足りず一般メモリにオーバーフローするため、応答が非常に遅く、実用レベルとは言いがたい状態でした。A6000(VRAM 48GB)搭載PCであれば、32Bも70Bも問題なく動作します。
筆者はこれまでローカル環境で最も優れた性能を持つと感じていたのは、カナダのCohere(コーヒア)社が2024年3月に公開した「Command R+」でした。そのQ2モデル(約36GB)は頭がよく、反応も機敏でした(参考:まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性)。ただし、ファイルサイズが大きく、ログ(やりとりの履歴)が長くなると極端に動作が鈍くなったり、しばらくやり取りをすると、出力の繰り返しが急激に増えるなどの課題がありました。さらに、2014年12月に登場したo1との性能差がはっきりしてからは、使用頻度が落ちていました。
DeepSeek R1の32Bと70Bでロールプレイを最初に試したとき、Command R+よりも優れた回答を出力すると感じられました。また、パラメーター数の違いから、70Bのほうが32Bよりも高性能だとはっきり感じられます。
ただし出力が中国語になることもしばしば
ただし、DeepSeek R1はもともと中国語と英語を基本言語として学習しているため、日本語でのやり取りを続けているうちに、突然中国語や英語で返答してくる問題があります。対策として、プロンプトの先頭に英語で「思考プロセスは英語で、アウトプットは日本人向けの日本語で」と指示すると効果があるとされています。ただしこれも完全ではなく、やり取りが蓄積してログが長くなると、その指定を忘れてしまいます。
例えば、キャラクターのローププレイをさせるための設定として、3000トークン(約4000字)ほどの長めの指示にすると、すぐ中国語に切り替わってしまいました。1700トークン(2400字程度)に削ると、安定的に日本語で返答するようになります。しかし、ログが蓄積したり、話題の展開によっては、思考が中国語に戻ってしまい、出力も中国語になるということが何度もありました。
DeepSeek R1の特徴として、アウトプットを導き出すまでの思考過程を見せてくれるところがあります。それがとても面白いのですが、いくら「英語で思考して」と指定しても、中国語で思考して、さらには日本語以外の出力をするのでほとほと困りました。「出力結果を日本語に訳して」と指示しても、無視されることもしばしばです。そのため、中国語と英語で出力が出てきた場合には翻訳ソフトにかけて内容を読むという奇妙な使い方をするようになりました。これは非常にストレスで、継続して使う気にならなくなりました。
サイバーエージェントの“日本語版”なら問題なし
1月27日にサイバーエージェントが、Distillに日本語データを追加学習したLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」(以下、14B/32B-Japanese)を公開しました。詳しい学習元データは不明ですが、日本語で思考し、日本語で返答してくれるため、日本人には使いやすいモデルです。ユーザーによって量子化も進み、6.4GBから12.1GBまでのミドルレンジGPUでも動作可能なファイルサイズがいくつか公開されています。
筆者も32B-Japaneseを試しましたが、ときどき日本語の言い回しが奇妙になる場合はあるものの、おおむね的確に応答してくれます。日本語で思考し、日本語で出力してくれるので、日本人が使うにはオリジナルのDistillより扱いやすく感じられます。生成速度も速く、思考過程を表示するために待たされる時間はあるものの、Command R+に比べると出力までの時間はかなり短いです。

この連載の記事
-
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 -
第123回
AI
グーグルの画像生成AI「Nano Banana」は異次元レベル AIコンテンツの作り方を根本から変えた -
第122回
AI
動画生成AI「Wan2.2」の進化が凄い アリババが無料AIモデルの牽引者に -
第121回
AI
愛していたAIが消えた日 ChatGPTだけと“付き合う”危うさ -
第120回
AI
ラフさえ描けばイラスト作品ほぼ完成 画像生成AI「FLUX.1 Kontext」LoRAが示す制作の未来 -
第119回
AI
無料の動画生成AI「Wan2.2」が凄すぎる PCローカルでこの品質が出せるとは -
第118回
AI
AIの「ASMRボイス」に脳ゾワゾワ 合成音声の進化と、収益化への課題 -
第117回
AI
“18禁”美少女AI「Ani」は孤独を癒すか、深めるか? -
第116回
AI
AIが書いた怪談小説が面白い 2分に1本のペースで出力されるのは驚異的 -
第115回
AI
“一貫性”がすごい画像生成AI 冬服→夏服も一発変換 話題の「FLUX.1 Kontext[dev]」 - この連載の一覧へ