画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。
画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」
使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字が増えるほど元の画像の要素が強くなっていきます。実写系のMidjourney、アニメ系に強いNijijourneyのどちらでも使用可能です。
まずは、過去にMidjourney v6で作成した画像で試してみましょう。完全にそっくりとはいきませんが、かなり似た顔や服装が出てきます。
プロンプトを少し修正して、「Running」とすると走っている様子が生成されました。こちらも完全にそっくりとは言えませんが、それなりに似た顔かつ、似た服装になっています。
では、影響度を落として、「--cw 0」で指定して顔だけが影響するように、桜の下にいるといプロンプトを加えてみます。
この応用方法は広く、この桜で生み出した画像の画像を、他の白黒画像のプロンプトと組み合わせたりすることもで、同じ人物を2次元的な表現にすることできます。
実在の人物でも似るのか筆者の写真で試してみましたが、雰囲気は引き継いでいるものの、あんまり似ていない気がします。他の画像でも試しましたが、Midjourneyで生成した画像の方が似る傾向がある印象があるため、フェイク対策で意図的にそっくりにならないような対策が入っているのかもしれません。
試しにドナルド・トランプ氏の写真を入力したところ、フィルターで弾かれたため、著名人の画像と認識された場合には生成できないように対策されているようです。
Nijijourneyで同じ画像を元に同じプロンプトで出してみると、得意なアニメ風の絵柄で出てきました。
さらに面白いこともできます。キャラクターシートを参照させることで、そのキャラクターのバリエーションを生成できるのです。以前作例として、VRoidをStable Diffusionに変換した3面図が簡単にできることをご紹介しましたが、それを指定することで、そのキャラクターに近い画像のバリエーションを容易に生み出せます。(※参考:画像生成AIが爆速で進化した2023年をまとめて振り返る )
参照元の画像をCreative Referenceに設定することで、様々な環境にいる一人のキャラクターを生み出すことができます。ただ、画像生成AIの弱点でもあるランダム性が交じるので、服の装飾といったディティールを固定することは難しいのですが。
現状、MidjourneyにはStable Diffusionのi2i(Image-to-Image)や拡張機能「ControlNet」にあたる機能がないので、ポーズや表情の指定をはっきりコントロールすることは難しいのですが、それでも一貫性のある人物やキャラクターの画像を作れる機能は重宝されるでしょう。
この連載の記事
-
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって -
第73回
AI
AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック -
第72回
AI
人が絵を描く“工程”をAIで再現 タイムラプス風動画が炎上した「Paints-Undo」 -
第71回
AI
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ -
第70回
AI
イラストのペン入れと色塗り、AI使えばわずか1分 - この連載の一覧へ