AIで「三面図」を出し、衣装のバリエーションを作る
東京ゲームショウ時の取材で見せたのは、その新しく試していた手法です。ゲームのヒロイン向けに追加の衣装を作ろうという話が出ており、新たにデザインを起こす必要が生まれました。ちょうど8月に登場した画像生成AI「FLUX.1」の性能が高く、デザイン的に一貫性を保ったままいきなり三面図を作成できることがわかったので試し始めたのです。
ディレクターからは「チャイナドレス風衣装は作れないか。物理オブジェクトがついている、ヒラヒラしているような」というオーダーがあったんです。またしても「なんやそれ……」という感じだったんですが(笑)。
まず、Midjourneyのアニメ系画像生成AIサービスの「Nijijourney」を使い、ヒラヒラしたチャイナドレス風衣装を着たキャラクターのバリエーションを大量に作りました。バリエーションを作る「Vary」の機能を使うことで、一度出た画像のバリエーションを出すことは簡単で、また生成にかかる時間もカエルの頃よりも格段に早くなっています。
次に、出てきた画像を選別し、30枚のセットにしてFLUX向けのLoRAを開発しました。LoRA作成ツールは「FluxGym」を使います。ポイントは三面図を出力することが目標であるため、そのなかに後ろ姿の画像も含めておくという点です。それにより、背面の出力も適切にできる可能性を高めることができます。
そして、ヒロインキャラクターの3Dモデルのスクリーンショットを用意し、Flux.1が動作するWebUI Forgeの環境で、LoRAと組み合わせてImage-to-Image(i2i)で生成します。これによって、様々な服装をした女性の三面図のバリエーションが、30秒に1枚くらいのペースで出せるようになりました。ControlNetを使ったほうが望ましい一貫性を作成できる可能性があるのですが、まだForgeではその環境が登場していないために、i2iで作成しています。
生成される画像は完璧ではなく、前後を取り違えたり、デザインが破綻していたりと完全な一貫性を担保できていないものも少なくないのですが、まずは十分です。
ここで出された三面図のなかから、どんなコンセプトを狙っていくのかという絞り込みを進めています。カエルの時よりも、精度が高い画像をより速く出せるようになっています。参考にできる画像が出てくると、ディレクターのイメージも膨らむもので、「若干SF的な意匠を盛り込んでほしい」などの追加注文が出てきます。それらを他の自作LoRAなどと組み合わせたり、レタッチ作業をして情報を整理しながら、精度を上げていきます。そして、まだ最終的な完成には至っていないのですが、最後は人間の手でデザインをまとめ上げていくことになります。

この連載の記事
-
第95回
AI
月3万円で使えるOpenAIの「Deep Research」 驚異的だが、情報格差が広がる不安も感じた -
第94回
トピックス
1000円あればOpenAIレベルのAIが作れる DeepSeekで注目の「蒸留」とは -
第93回
AI
DeepSeek R1、無料で使えるAIとしては最強クラス -
第92回
AI
動画生成AI、ついにアダルトの扉が開く -
第91回
AI
AIの書いた小説が普通に面白い ChatGPT「o1」驚きの文章力 -
第90回
トピックス
画像生成AIで年賀状 リアルな人物も簡単に -
第89回
AI
OpenAI「Sora」残念な離陸 中国勢が飛躍する動画生成AI -
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 - この連載の一覧へ