AIで「三面図」を出し、衣装のバリエーションを作る
東京ゲームショウ時の取材で見せたのは、その新しく試していた手法です。ゲームのヒロイン向けに追加の衣装を作ろうという話が出ており、新たにデザインを起こす必要が生まれました。ちょうど8月に登場した画像生成AI「FLUX.1」の性能が高く、デザイン的に一貫性を保ったままいきなり三面図を作成できることがわかったので試し始めたのです。
ディレクターからは「チャイナドレス風衣装は作れないか。物理オブジェクトがついている、ヒラヒラしているような」というオーダーがあったんです。またしても「なんやそれ……」という感じだったんですが(笑)。
まず、Midjourneyのアニメ系画像生成AIサービスの「Nijijourney」を使い、ヒラヒラしたチャイナドレス風衣装を着たキャラクターのバリエーションを大量に作りました。バリエーションを作る「Vary」の機能を使うことで、一度出た画像のバリエーションを出すことは簡単で、また生成にかかる時間もカエルの頃よりも格段に早くなっています。
次に、出てきた画像を選別し、30枚のセットにしてFLUX向けのLoRAを開発しました。LoRA作成ツールは「FluxGym」を使います。ポイントは三面図を出力することが目標であるため、そのなかに後ろ姿の画像も含めておくという点です。それにより、背面の出力も適切にできる可能性を高めることができます。
そして、ヒロインキャラクターの3Dモデルのスクリーンショットを用意し、Flux.1が動作するWebUI Forgeの環境で、LoRAと組み合わせてImage-to-Image(i2i)で生成します。これによって、様々な服装をした女性の三面図のバリエーションが、30秒に1枚くらいのペースで出せるようになりました。ControlNetを使ったほうが望ましい一貫性を作成できる可能性があるのですが、まだForgeではその環境が登場していないために、i2iで作成しています。
生成される画像は完璧ではなく、前後を取り違えたり、デザインが破綻していたりと完全な一貫性を担保できていないものも少なくないのですが、まずは十分です。
ここで出された三面図のなかから、どんなコンセプトを狙っていくのかという絞り込みを進めています。カエルの時よりも、精度が高い画像をより速く出せるようになっています。参考にできる画像が出てくると、ディレクターのイメージも膨らむもので、「若干SF的な意匠を盛り込んでほしい」などの追加注文が出てきます。それらを他の自作LoRAなどと組み合わせたり、レタッチ作業をして情報を整理しながら、精度を上げていきます。そして、まだ最終的な完成には至っていないのですが、最後は人間の手でデザインをまとめ上げていくことになります。
この連載の記事
-
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた - この連載の一覧へ