アドビの台頭と「AIグラビア」問題
画像生成AIが話題になるなか、大手企業として本格的に入ってきたのがアドビ。3月22日に「Adobe Firefly」のベータ提供を開始し、話題になりました(一般提供開始は9月)。
いまだにFireflyの課題としてあるのは、1024×1024ピクセルでの画像しか生成できないこと。大きな画像サイズの場合は生成した画像をアップスケールしているようで、レスポンスは早いものの、画面の端がぼやけてしまうという難点があります。実際にプロが使いはじめると、スケールが小さすぎて使いものにならないことが課題になっています。
おそらくアドビは今後、毎月付与される有料ポイントを使うとディテールを高めるといったオプションを作るのではないかと予想されています。
とはいえ、現状でも削除機能は非常に優秀で、業務のなかでは頻繁に使う機能になりました。要らないものをまとめて消したり、画面の端に足りないものを足したりするのは非常に便利です。
商用利用という意味で言えば、著作権に関するリスクをアドビが負ってくれるということで使いはじめているという人も増えました。その後、マイクロソフトやグーグルなど各社が生成AI著作権リスクを補償するという形になってきましたね。逆に言うなら、著作権侵害裁判が来たとしても、それに打ち勝てる自信を持っているとも言えます。
実際、アメリカでは生成AIのプラットフォーマーを相手に著作権侵害を訴える裁判が始まっています。ただしこの1年、日本国内では知る限り、生成AIで生み出された結果に対して、著作権侵害を問う裁判は1件も提起されていません。
そんななか、5月には集英社がAIグラビア「さつきあい」を出して、すぐ引っ込められてしまうということがありました。特定の人物のLoRAを使っているんだろうと言われて引っ込めたとされています。このあたりから、いわゆる「狙い撃ちLoRA」のようなモデルの「類似性」と「依拠性」が著作権上の問題として意識されはじめました。
「SDXL」と「動画生成AI」の勃興
8月に入ると、Stable Diffusion最新版の「Stable Diffusion XL(SDXL)」が登場。それまでは512x512ピクセルで学習をしていましたが、SDXLでは1024x1024ピクセルに高画質化。これにより、より精密な画像を作れるようになりました。学習元データは、著作権者が希望すればデータセットからのオプトアウトができるようになり、比較的クリーンになったとされています。
ただ、過去のStable Diffusionとデータの互換性がない上に、求められるグラフィックスカードなどのスペックが上昇したこともあり、最初はあまり反応がありませんでした。しかしその後、コミュニティが徐々に成長していき、SDXL用のモデルも増加してきました。SDXL専用のControlNetも開発されはじめています。
そして同月、SDXL向けのインターフェースとして登場したのが「Fooocus」です。
Fooocusは、それまでの「WebUI」「ComfyUI」といったStable Diffusion向けのインターフェースに比べて、圧倒的にシンプルで使いやすいのが特徴。最初は機能を絞っていましたが、徐々に多機能なソフトへと成長していきました。今ではControlNetの一部機能を取り入れて、1枚絵だけでLoRAを作れるようにもなっています。
同時期には、ノードベースの生成環境「ComfyUI」も登場しました。スクリプトを組むように生成プロセスを設計できて、カスタマイズも容易な上に余計なプロセスがないので処理も早いということで人気になりました。Stablity UIの公式環境にもなったことで、Stable Diffusionの最新技術を実験するための環境として普及が進んでいます。
こうしたインターフェースがSDXLを引っ張っている最前線と言えますね。
また、このSDXLと同時期に発展してきたのが動画生成AI。有力なのが有料サービスの「Runway」です。最初はしょぼいものしかできず、いわば運任せの「ガチャ」でしたが、世代が進むにつれてカメラをコントロールしたり、着実にバージョンアップを重ねながら、全体的なクオリティを上げてきています。
Runwayで筆者が数時間ほど格闘して作ったサンプルMV(「動画生成AIがすごすぎる 映画登場も遠くない」より)
もうひとつの方向が、ローカル環境でアニメっぽいものが生成できる「Animatediff」。これは特にオンラインコミュニティのなかで爆発し、色々な技術が開発されました。
特に「ComfyUI」に実装されて、改造して制御を効かせようという技術がコミュニティ内で発展していきました。自分で制御ができるということもあり、Animatediffを使って本格的なアニメーションを作ろうとする人々も出てくるようになりました。これは非常に大きな変革だったと言えます。
この連載の記事
-
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた - この連載の一覧へ