メタデータを残さない“表現の自由”重視の仕組み
そして、Fooocusの開発過程で明らかになったのが、lllyasvielさんのハッカー的な思想が込められていることでした。Fooocus最大の特徴とも言えるのが、画像にメタデータを残さないことです。
Stable Diffusionは画像生成時、「どういうパラメータ設定で生成したのか」という情報をメタデータとして画像内に残すのが当たり前でした。画像には、使用したチェックポイント、プロンプト、Seed値(乱数値)などのデータが情報として残されています。自分や人が作った画像と同じ条件を再現しようとしたとき、画像から簡単に参照できるため、非常に重宝されている機能です。当然、Fooocusのリリース時からもユーザーから機能追加の要望が出ていました。
しかし、lllyasvielさんはそうしたメタデータは画像に残さないというアナウンスを出しました。Fooocusでは「一般人でそこまで深く触る人はいないから」という理由を挙げていましたが、彼が重要視しているのはプライバシーのようです。
画像が生成AIで作られたかどうかを認識するためのメタデータの埋め込みはいま、画像生成AIにとって重要な焦点になっています。Adobeやマイクロソフトといった大手企業は、どのような作業環境で作成された画像であるのかをメタデータを組み込むことで、判別できるような環境を社会に普及させようとしています。
しかし、Illyasivielさんはあえてその逆を行こうとしているのです。
ここには表現の自由というか、表現者のプライバシーは守られるべきだという考えが根底にあります。ハッカー思想の伝統のなかには、「データは誰にも束縛されるべきでない」というカウンターカルチャー的な側面があります。Stable Diffusionの極端な公開性にも通じる思想です。lllyasvielさんは、生成時にあえてメタデータを残さないことにより、どんな権威にも拘束されない画像データを生み出せる仕組みを担保しようとしているのです。
とはいえ、メタデータは入っていたほうが使用上便利なところがあり、多くの人からの追加の要望はなくなりませんでした。そこで折衷案としてFooocusではローカル環境にHTMLベースでログを残すようにしています。ログを見れば過去にどういう環境で作ったかがわかるということですね。他人が画像を見てもわかりませんが、利用者本人は再現可能になっています。
しかし、ここでさらに興味深いことが起こりました。lllyasvielさんがアップデートを中断後の8月26日に、MoonRide303さんがオリジナルのソースコードを改造した派生モデル「Fooocus-MRE(Moon Ride Edition)」をリリースしたのです。
追加機能としてimage2imageの機能のサポートと、ControlNetの一部サポート、さらにメタデータの入力機能を備えたものです。
MoonRide303さんは、Fooocusが「ジェネレーティブ・アートへの最初の一歩を踏み出そうとしているカジュアル・ユーザーにとって使いやすいシンプルなUI」を備えていることを絶賛しつつも、「lllyasvielさんがステップ、サンプラー、スケジューラーなどの設定などの基本的な機能まで外してしまった」と述べています。そのうえで、「Fooocusの元々のバージョンで私が必要だと思った基本的な機能を実装することにしました。Fooocus-MREは同じ哲学を貫き、できるだけシンプルに保ちたい」としています。
Fooocusのソースコードは公開されているため、誰でも派生モデルを開発できます。Stable Diffusionを巡る開発環境も多くが公開されているため、他のアプリのソースを参照することにより、こうしたことができてしまうのです。確かに、Fooocus-MREの方が、すでに画像生成AIについて一定の知識を持つ人にとっては、使いやすい面もあります。今後、本家のFooocusとFooocus-MREがどのような発展のプロセスをたどっていくのかは注目されていくでしょう。
この連載の記事
-
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって - この連載の一覧へ