複雑な髪形や服装でもしっかり再現
なぜ、AnimaとSDXLでこれほど差が出るのでしょうか。一つには、SDXLが写真などの汎用環境からスタートし、人気のモデルも、様々なモデルとのマージや追加学習を繰り返しているために、非常に複雑な潜在空間を持つようになっていることが大きいと考えられます。そして、SDXLでは、様々な潜在空間を構成する層に画像を学習させていく必要があるため、効果が出るまでに時間がかかるという特徴があるようです。
それに対して、Animaは「NVIDIA Cosmos」由来のモデルをベースにしており、全体を新しいデータで学習させたモデルで、画像の理解にも「Qwen3」系の新しい技術が採用されています。その上、アニメ特化で余分なものが足されていないため、LoRAの効果がより短い学習で出せるということのようです。言うなれば、余計な学習が足されていない分、「素直」なのです。
次に、もう少し複雑なキャラでも実現可能か試してみましょう。
まず、Animaで、ゲームに登場することを想定したSF風キャラクター(仮称アスレナさん)を1枚生成しました。意識的に、デザインが複雑なものを生成しました。
それを、ローカルPCでも動作するアリババの画像AIモデル「QwenImageEdit-2511」のマルチアングルLoRAを使い、様々な角度やポーズの差分画像を多数作り、品質が高く、一貫性が維持できていると思われる50枚ほどを選びました。筆者は、それらにAnimaに適したタグ付けを行い、データセットを作成しました。
この50枚にキャプションを付け、データセットを作り、様々なシーンを想定して生成した画像が以下です。ステップ数は1000で学習をしています。50枚でも、学習にかかったのは30分程度でした。
特徴的なマント、頭の2本のヘッドセットのアンテナ、前髪とは異なる後ろ髪、水色の剣など、かなり再現できています。肩の紋章や、胸部分のデザインといった、差分データの時点で曖昧だった部分は、その曖昧さがそのまま出てしまっていますが、さらに画像を吟味して品質の高いデータで構成できれば、さらに一貫性のある高品質な画像を出力できると思われます。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第157回
AI
AIだけでゲームは作れるのか? Codexに7本作らせて見えた実力と限界 -
第156回
AI
ChatGPTの画像生成AIは本当に最強か Nano Bananaと比べて見えた“弱点” -
第155回
AI
非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話 -
第154回
AI
ChatGPTの画像生成AIが強すぎる AI画像が世界中に氾濫する時代へ -
第153回
AI
ChatGPTの画像生成AIが「Nano Banana」超え? 漫画や動画風カットが実用レベルに -
第152回
AI
Seedance 2.0×AIエージェントでAI動画が激変 “AI脚本家”や“AI絵コンテ作家”との共同作業で、アニメ制作が身近に -
第151回
AI
画像・動画生成AIの常識が変わる、Claude Codeに全部やらせる方法論 -
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 - この連載の一覧へ








