4月下旬に、アドビの「Photoshop」や「Lightroom」で使えるAI機能「Adobe Firefly」に大幅なアップデートがありました。「Image 3」という新モデルがプレビュー版として追加され、全体的な品質が上がっています。部分的には画像生成AIのコントロールツール「ControlNet」のような様々な設定ができるようになったことで、制御しやすさが増しました。また、存在しない画面外の領域を追加で生成できる「生成拡張」機能が入ったり、企業向けですが、「スタイルキット」を使うことで、一貫性を保ったまま、他の画像を試したりできるようになっています。
「東京の高層ビル」だけで本物と見紛うクオリティー
Fireflyはウェブサイトを通じてサービスが提供されています。例えば、「東京の高層ビル」として生成すると、10秒ほどで4枚の2048x2048の画像が生成されます。これは旧モデルの「Image 2」と比較すると、画像が破綻しがちだったところがかなり解消されています。パッと見たら本物と見紛うクオリティーで、写真のような生成結果は、Fireflyならではの強みといった感じです。画像サイズは、横(4:3)、縦(3:4)、正方形(1:1)、ワイドスクリーン(16:9)から選ぶ方式です。プロンプトは、日本語でも入力が可能です。
使い方がわかりやすいのは「構成」という新機能。これは参照先となる画像を入力すると、それに合わせて、画像を生成してくれるものです。画像生成AI「Stable Diffusion」のコントロールツール「ControlNet」のひとつ、線を抽出して画像に反映する機能「Canny」に近い原理で動作していると考えられます。東京の高層ビルの画面構成をコントロールしようとしたら、白黒での画像をアップロードすると、その画像を参照して、東京の高層ビルを生成してくれます。日本のビルっぽい雰囲気を生成するには、国土交通省が公開している3D都市モデル「PLATEAU(プラトー)」の「PLATEAU VIEW 3.0」が使いやすいのでおすすめです。
PLATEAUの画像を利用して、「構成」の参照画像として指定すると、それに合わせ、現実にはないそれっぽい東京の画像を生成してくれます。
天気を変えたり、夜景にしたりすることもできます。ビルの構成を完全に一致させることはできませんが、参照画像に基づいて生成されているので、それなりに一貫性がある画像を生成することができます。同じ画像を使い、ニューヨークやロンドンなど、まったく違う都市、さらにはスチームパンクな都市、城などを生成してもそれなりに反映されます。
しかし、これを人物でやるとあんまり似ません。いつものこの連載でおなじみのAIキャラクター「明日来子さん」の画像をどれくらい再現できるかと構成を試してみたのですが、まったく別の人物が出てきます。構図は維持されていますが、はっきりと別人と思われる女性が生成されます。また、生成ポリシーに引っかかるプロンプトは無視されるようで、「少女」というワードは有効ではなく、「女性」とする必要がありました。これはおそらく意図的なもので、フェイク対策の意味合いが強いのだろうと思えます。アドビは、顔を似せる機能は別に検討しているようですが、現状では同じ顔を生成させることは難しいと言えます。
![](/img/blank.gif)
この連載の記事
-
第69回
AI
“革命”起こした画像生成AIに暗雲 「Stable Diffusion 3 Medium」の厳しい船出 -
第68回
AI
AIが作る3Dモデルの完成度が上がってきた 毎回異なるモンスターが生成されるゲームも実現か -
第66回
AI
有名人そっくり、増え続けるAI音声 “声の権利”どう守る -
第65回
AI
画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 -
第64回
AI
自分好みのAIチャット相手を簡単に作れる「Dify」が面白い -
第63回
AI
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 -
第62回
AI
動画生成AI、映像制作の“民主化”目指して研究進む -
第61回
AI
画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも -
第60回
AI
3Dアニメーション技術の革新が止まらない -
第59回
AI
政府、生成AI推進に向けて議論を加速 - この連載の一覧へ