このページの本文へ

前へ 1 2 3 次へ

新清士の「メタバース・プレゼンス」第58回

画像生成AIで同じキャラクターが簡単に作れるようになってきた

2024年03月25日 07時00分更新

文● 新清士　編集●ASCII

Stable Diffusion「ControlNet」IP-Adapterがベースか

IP-Adapterは、元の画像を参考の要素を抽出して、類似の画像を生み出す。元の画像は一番上で、二段目以降は、それぞれのモデルによる生成結果の違い。
（「IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models」より）

　Creative Referenceのベースは、ControlNetの新技術。昨年10月にテンセントが開発・公開した「IP-Adapter」の機能を独自拡張したものではないかと推測されます。

　もともとControlNetは画像をプロンプトとして利用可能にする技術ですが、IP-Adapterは、さらにタグ解析もして、その画像と解析後のテキストの両方をセットにして画像生成をするLatent（潜在）空間に送り込み、出力する画像の結果に影響を与えるという方法です。元画像全体の全体的な雰囲気に影響を与えられる点が画期的でした。

　「Stable Diffusion WebUI」や「ComfyUI」といったStable Diffusionのユーザーインターフェースには、発表から早い段階でControlNetの機能の1つとして実装されました。

Stable Diffusion WebUI ForgeのControlNetで、IP-Adapterの設定をしているところ

　その後、顔のみに影響を与えるモデル、SDXL用のバージョンも登場して、広く使われています。WebUIでは使用しているチェックポイントのモデルの影響を大きく受けるため期待するほどそっくりはなってくれない傾向がありますが、かなり雰囲気は似てくれます。

Stable Diffusion 1.5のモデルを使って生成した画像。顔や町並みの雰囲気に類似性は出ている（筆者作成）

　一方で、ComfyUIでは、AnimateDiffで動画を作るときに、顔や服装に一貫性を保つためのテクニックとして使わることも多いですね。

*AIアニメ: ControlNet+IPAdapterテスト #AnimateDiff #ComfyUI #aiart pic.twitter.com/ffGZbCsC9x
— Baku (@bk_sakurai) October 5, 2023

　画像生成AIサービスの「NovelAI」も、IP-Adapterとほぼ同様の機能を追加しています。

　2月に新機能として実装された「バイブストランスファー」と呼ばれる機能で、ベースの画像に合わせて似た雰囲気の画像を生み出してくれるというものです。いい加減な画像を入れても、プロンプトとセットで何かの絵を生み出してくれるのは便利です。

元絵をバイブストランスファーで設定して出力した画像。NovelAIはどうしてもアニメ・イラスト風の画像にはなってしまうが、雰囲気は出ている

　現状、キャラだけに似せるといったことはできませんが、NovelAIにはi2iの機能があるため、特定のポーズをしたキャラクターを他の画風にするといったことが簡単にできます。

i2iとバイブストランスファーとを組み合わせた画像。i2iにリアルのベース画像を設定し、バイブストランスファーにキャラ三面図を指定した

　さらにNovelAIはマスクも使えるので、顔だけ囲って生成することもできます。画像が持っているニュアンスを適当に読み込んでくれるので便利です。プロンプト解析は入っていないので同じ系統のパターンを出しづらいという弱点はありますが、違った種類の画像が出せます。

バイブストランスファーでキャラ三面図を指定しつつ、キャラクターの顔をマスクし、プロンプトで眼鏡を指定した。その結果、アニメ風キャラになりつつ、眼鏡を掛けたキャラになった

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年05月21日

AI

しまむら、AIモデル「るな」起用　20歳の服飾専門学生（という設定）
2024年05月27日

AI

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場
2024年06月07日

AI

めちゃ便利になった無料版「ChatGPT」新機能の使い方まとめ【最新版】
2024年05月16日

AI

ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）
2024年05月13日

AI

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性
2024年05月29日

AI

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる
2024年05月15日

AI

新しい「ChatGPT」はココがすごい　解説「GPT-4o」
2024年05月09日

AI

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」
2024年05月10日

AI

15歳の高校生、「日本語能力最強」のAIモデル開発　AITuber向けに設計
2024年05月20日

AI

自分好みのAIチャット相手を簡単に作れる「Dify」が面白い

ピックアップ

sponsored
ファッショナブルなデザインに、ヘルスケアやワークアウトの機能が充実！

「HUAWEI WATCH GT 4」はバッテリー長持ち＆デザイン色々、あらゆる人にオススメ可なスマートウォッチの本命！
sponsored
PC/IT系編集者の心構えに通ずるありがたい説法も

再起の時来たれり！インテルPCマイスター上級試験・不合格者のための補講を受けた話【実技編】
sponsored
次回の試験前にぜひ学んでほしい傾向と対策

再起の時来たれり！インテルPCマイスター上級試験・不合格者のための補講を受けた話【筆記編】
sponsored

マザーの背面コネクターって実際どう？ASUS「BTF」で組んでみたら世界が変わった
sponsored

知っておいて損はなし！耐久性◎なCrucialポータブルSSDの選び方・使い方を大紹介
sponsored

クリエイターPCの選び方　写真、動画編集、3DCGのガチプロにオススメのWindowsノートはこれでした
sponsored
新色ベージュが追加＆アップデートで待望のイヤホン単体でのボリューム調整にも対応！

耳を塞がない＆メガネ派もOK！ファーウェイの独自スタイルのオープンイヤー型イヤホンはながら聴きに最適！
sponsored
結局どっちがお得？考え方の違い、クラウドストレージのコストを最小限に抑える方法

ファイルサーバー／NASとクラウドストレージの「コスト」を比較する
sponsored
Northを使ったオシャレPCと、会社の生放送で活躍できる最強PCが爆誕！

PCケースもパーツも！イッペイ＆つばさが理想のBTOPCをカスタマイズ、どんな構成に？
sponsored
JN-MD-IPS133WUXGARをレビュー

16：10で1920×1200ドットの13.3型モバイルディスプレーが2万円は無敵！でも……
sponsored
4つの新モデルを追加、「HPE Networking Instant On」ならば“適材適所”で選択できる！

自社に最適なWi-Fiアクセスポイントは？選び方のコツをHPE Aruba Networkingのプロに聞いた
sponsored
X-360Q（JN-27IPS360WQHDR-HSP）をレビュー

360Hz・WQHDの27型ゲーミングディスプレーが9万円台！ KVMも90W給電も使えてお得感大
sponsored
「JAPANNEXT 上総中川駅」誕生の経緯をいすみ鉄道の社長にインタビュー

ディスプレー会社が駅名に!? JAPANNEXT×いすみ鉄道の異色コラボはなぜ実現したのか
sponsored
Radiant GZ3500Z790/D5をカスタム

BTOってマジ大事。16万円台のふつ～なPCが20万円のi5＆RTX 4060のゲーミングPCに
sponsored
音を知る企業による自社ブランドの第一弾製品

一生使いたいヘッドホンを見つけた。その名は「The Industrial-ist Wired」だ！
sponsored
見た目スッキリでキレイなPCが誰でも簡単に組める

自作PCの配線ゴチャゴチャは過去の話、「PROJECT ZERO」製品一覧と作例を紹介
sponsored
ゲームも作業もすべてがなめらか表示

ヌルヌル動くというのはこのこと、240Hzゲーミングディスプレー「G274QPX」レビュー
sponsored
「STYLE-14FH128-U7-UH2X」をチェック、16:10ディスプレーを採用

1kg以下の14型ノートPCで「Stable Diffusion」も、Core Ultra 7でやりたいことを加速しよう