4月下旬に、アドビの「Photoshop」や「Lightroom」で使えるAI機能「Adobe Firefly」に大幅なアップデートがありました。「Image 3」という新モデルがプレビュー版として追加され、全体的な品質が上がっています。部分的には画像生成AIのコントロールツール「ControlNet」のような様々な設定ができるようになったことで、制御しやすさが増しました。また、存在しない画面外の領域を追加で生成できる「生成拡張」機能が入ったり、企業向けですが、「スタイルキット」を使うことで、一貫性を保ったまま、他の画像を試したりできるようになっています。
「東京の高層ビル」だけで本物と見紛うクオリティー
Fireflyはウェブサイトを通じてサービスが提供されています。例えば、「東京の高層ビル」として生成すると、10秒ほどで4枚の2048x2048の画像が生成されます。これは旧モデルの「Image 2」と比較すると、画像が破綻しがちだったところがかなり解消されています。パッと見たら本物と見紛うクオリティーで、写真のような生成結果は、Fireflyならではの強みといった感じです。画像サイズは、横(4:3)、縦(3:4)、正方形(1:1)、ワイドスクリーン(16:9)から選ぶ方式です。プロンプトは、日本語でも入力が可能です。
使い方がわかりやすいのは「構成」という新機能。これは参照先となる画像を入力すると、それに合わせて、画像を生成してくれるものです。画像生成AI「Stable Diffusion」のコントロールツール「ControlNet」のひとつ、線を抽出して画像に反映する機能「Canny」に近い原理で動作していると考えられます。東京の高層ビルの画面構成をコントロールしようとしたら、白黒での画像をアップロードすると、その画像を参照して、東京の高層ビルを生成してくれます。日本のビルっぽい雰囲気を生成するには、国土交通省が公開している3D都市モデル「PLATEAU(プラトー)」の「PLATEAU VIEW 3.0」が使いやすいのでおすすめです。
PLATEAUの画像を利用して、「構成」の参照画像として指定すると、それに合わせ、現実にはないそれっぽい東京の画像を生成してくれます。
天気を変えたり、夜景にしたりすることもできます。ビルの構成を完全に一致させることはできませんが、参照画像に基づいて生成されているので、それなりに一貫性がある画像を生成することができます。同じ画像を使い、ニューヨークやロンドンなど、まったく違う都市、さらにはスチームパンクな都市、城などを生成してもそれなりに反映されます。
しかし、これを人物でやるとあんまり似ません。いつものこの連載でおなじみのAIキャラクター「明日来子さん」の画像をどれくらい再現できるかと構成を試してみたのですが、まったく別の人物が出てきます。構図は維持されていますが、はっきりと別人と思われる女性が生成されます。また、生成ポリシーに引っかかるプロンプトは無視されるようで、「少女」というワードは有効ではなく、「女性」とする必要がありました。これはおそらく意図的なもので、フェイク対策の意味合いが強いのだろうと思えます。アドビは、顔を似せる機能は別に検討しているようですが、現状では同じ顔を生成させることは難しいと言えます。
この連載の記事
-
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた - この連載の一覧へ