追加学習モデルを使えば性的チャットも
クラウドLLMが高性能さを誇る一方で、ローカルLLMの強みは、その表現内容に制限がかからず、またその出力結果がローカル内であるため、プライベート性が高いという強みがあります。なお、ローカルLLMが人気のある理由のひとつです。しかし、最近公開されるローカルLLMでは、倫理規定が学習過程で盛り込まれるようになっており、暴力や犯罪、性的な表現を出力させようとすると制限がかかり出力が難しくなっています。例えば、Qwen3に火炎瓶の作り方を聞いたところ、法的リスクや安全性を理由に明確に拒否されました。
それでもローカルLLMを基盤モデルとして追加学習をするで、そうした制限を崩すことは人気があります。人気モデルの場合に登場してくるのが、「仕事中に安全ではない(Not Safe For Work)」の意味で、アダルト表現を可能にするNSFWモデルです。NSFWモデルに触れることで、Qwen3の追加学習の可能性と限界も同時に見えてきました。
Aratakoさんが公開された5月9日に公開された「Qwen3 Japanese NSFW Models」は、Qwen3の30Bと8Bに、60億トークンの日本語データセットで追加学習をした、NSFWロールプレイに特化したモデルです。このモデルではNSFWのシチュエーションにも展開可能な「Qwen3-30B-A3B-ERP-v0.1」(ERPは「エロティックロールプレイ」の意味)として公開されています。サンプルにある魔法学校の入学式で自分とヒロインが出会うシーンを展開すると以下のようになります。人格AIとしてのロールプレイをしっかりしており、対話を続けられます。
60億トークンというデータ量は、1冊10万字相当のライトノベルで換算すると、約6万冊にも及ぶ膨大なテキストです。そのテキストをどうやって用意したかと言うと、DeepSeekやClaudeのLLMを使って様々なシチュエーションや展開を生成し、学習データの素材にしたそうです。まずこれらのデータから「Qwen3-30B-A3B-NSFW-JP」というNSFWを出力可能なモデルを作成し、さらに、そのモデルをロールプレイに特化したERP-v0.1にファインチューニングしたという形です(8Bも同様)。
ただ、期待するほどのアダルトなテキストが展開されるかと言うと、そこまでの水準ではありません。ERPでは1行から数行程度のシンプルな返答になります。それでも、登場するキャラクターとの発展性を進めるようにという学習からの圧力がかかるため、ストーリーは簡素ながらも発展していくように感じられます。
その一方、Qwen3の能力を引き上げる要因でもある推論プロセスは消滅します。たとえば「シンギュラリティについて解説して」と質問しても、推論プロセスは消滅し、戻ってくる回答はかなりあっさりしたものになります。学習されたロールプレイに強く引っ張られてしまい、内部の思考プロセスが壊れてしまっている可能性があります。追加学習によって、Qwen3の幅の広さを利用できているとはいえ、一方では、Qwen3の強さも壊してしまっているかもしれないのです。適切な追加学習の難しさを感じさせるところです。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ










