このページの本文へ

前へ 1 2 3 次へ

新清士の「メタバース・プレゼンス」 第58回

画像生成AIで同じキャラクターが簡単に作れるようになってきた

2024年03月25日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。

画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」

 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字が増えるほど元の画像の要素が強くなっていきます。実写系のMidjourney、アニメ系に強いNijijourneyのどちらでも使用可能です。

 まずは、過去にMidjourney v6で作成した画像で試してみましょう。完全にそっくりとはいきませんが、かなり似た顔や服装が出てきます。

過去の作例を今回のベース画像とした(筆者作成)

プロンプトは、「1girl, simle –cref (画像をアップしたURL) – ar 2:3」と簡単なもの(筆者作成)

 プロンプトを少し修正して、「Running」とすると走っている様子が生成されました。こちらも完全にそっくりとは言えませんが、それなりに似た顔かつ、似た服装になっています。

プロンプトは、「1girl, dash, running, smile, city --cref (画像をアップしたURL) --ar 3:2 」と同じく簡単なもの(筆者作成)

 では、影響度を落として、「--cw 0」で指定して顔だけが影響するように、桜の下にいるといプロンプトを加えてみます。

プロンプトは「Japanese beautiful 1girl, (full body:1.3), under cherry cherry blossom, spring –-cref (画像をアップしたURL) –cw 0 --ar 3:2」。少し日本人のニュアンスを強めるためにJapaneseを追加した(筆者作成)

どれくらい生成されたものと顔が似ているのかを比較してみると、微妙な違いはあるもののかなり似た雰囲気になっている(筆者作成)

 この応用方法は広く、この桜で生み出した画像の画像を、他の白黒画像のプロンプトと組み合わせたりすることもで、同じ人物を2次元的な表現にすることできます。

Describe機能でSF的な白黒画像からテキストプロンプトを生成した後、そのプロンプトにCrefを付けてさらに生成することで、同じ人物の雰囲気を保ちながらまったく別の絵柄にすることができる(筆者作成)

 実在の人物でも似るのか筆者の写真で試してみましたが、雰囲気は引き継いでいるものの、あんまり似ていない気がします。他の画像でも試しましたが、Midjourneyで生成した画像の方が似る傾向がある印象があるため、フェイク対策で意図的にそっくりにならないような対策が入っているのかもしれません。

筆者の写真を元に生成してみたもの。右が筆者。雰囲気はあるが似ているようで違っている。同一人物と見るには違和感がある(筆者作成)

ドナルド・トランプ氏の画像を入れたところ、生成を拒否された

 試しにドナルド・トランプ氏の写真を入力したところ、フィルターで弾かれたため、著名人の画像と認識された場合には生成できないように対策されているようです。

 Nijijourneyで同じ画像を元に同じプロンプトで出してみると、得意なアニメ風の絵柄で出てきました。

Nijijourneyでの生成。アニメ風のクセはあるものの、近いものが出ている(筆者作成)

 さらに面白いこともできます。キャラクターシートを参照させることで、そのキャラクターのバリエーションを生成できるのです。以前作例として、VRoidをStable Diffusionに変換した3面図が簡単にできることをご紹介しましたが、それを指定することで、そのキャラクターに近い画像のバリエーションを容易に生み出せます。(※参考:画像生成AIが爆速で進化した2023年をまとめて振り返る

参照元にしたキャラ三面図

左から、走る、カフェでコーヒーを飲む、制服姿、カジュアル服で桜の下という設定で、参照元画像を使って生成した画像(筆者作成)

 参照元の画像をCreative Referenceに設定することで、様々な環境にいる一人のキャラクターを生み出すことができます。ただ、画像生成AIの弱点でもあるランダム性が交じるので、服の装飾といったディティールを固定することは難しいのですが。

一部ユーザーに先行してテスト公開が始まっているブラウザ版では、画像をドラッグ・アンド・ドロップするだけで、Crefの参考画像として指定できる

 現状、MidjourneyにはStable Diffusionのi2i(Image-to-Image)や拡張機能「ControlNet」にあたる機能がないので、ポーズや表情の指定をはっきりコントロールすることは難しいのですが、それでも一貫性のある人物やキャラクターの画像を作れる機能は重宝されるでしょう。

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事
ピックアップ