このページの本文へ

新清士の「メタバース・プレゼンス」 第35回

誰でも使える、誰にも覗かれない

画像生成AIに“表現の自由”を スーパーハッカーが挑んだ「Fooocus」

2023年09月04日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

メタデータを残さない“表現の自由”重視の仕組み

 そして、Fooocusの開発過程で明らかになったのが、lllyasvielさんのハッカー的な思想が込められていることでした。Fooocus最大の特徴とも言えるのが、画像にメタデータを残さないことです。

 Stable Diffusionは画像生成時、「どういうパラメータ設定で生成したのか」という情報をメタデータとして画像内に残すのが当たり前でした。画像には、使用したチェックポイント、プロンプト、Seed値(乱数値)などのデータが情報として残されています。自分や人が作った画像と同じ条件を再現しようとしたとき、画像から簡単に参照できるため、非常に重宝されている機能です。当然、Fooocusのリリース時からもユーザーから機能追加の要望が出ていました。

 しかし、lllyasvielさんはそうしたメタデータは画像に残さないというアナウンスを出しました。Fooocusでは「一般人でそこまで深く触る人はいないから」という理由を挙げていましたが、彼が重要視しているのはプライバシーのようです。

 画像が生成AIで作られたかどうかを認識するためのメタデータの埋め込みはいま、画像生成AIにとって重要な焦点になっています。Adobeやマイクロソフトといった大手企業は、どのような作業環境で作成された画像であるのかをメタデータを組み込むことで、判別できるような環境を社会に普及させようとしています。

 しかし、Illyasivielさんはあえてその逆を行こうとしているのです。

 ここには表現の自由というか、表現者のプライバシーは守られるべきだという考えが根底にあります。ハッカー思想の伝統のなかには、「データは誰にも束縛されるべきでない」というカウンターカルチャー的な側面があります。Stable Diffusionの極端な公開性にも通じる思想です。lllyasvielさんは、生成時にあえてメタデータを残さないことにより、どんな権威にも拘束されない画像データを生み出せる仕組みを担保しようとしているのです。

 とはいえ、メタデータは入っていたほうが使用上便利なところがあり、多くの人からの追加の要望はなくなりませんでした。そこで折衷案としてFooocusではローカル環境にHTMLベースでログを残すようにしています。ログを見れば過去にどういう環境で作ったかがわかるということですね。他人が画像を見てもわかりませんが、利用者本人は再現可能になっています。

Outputフォルダの中に残される生成画像のログデータ

 しかし、ここでさらに興味深いことが起こりました。lllyasvielさんがアップデートを中断後の8月26日に、MoonRide303さんがオリジナルのソースコードを改造した派生モデル「Fooocus-MRE(Moon Ride Edition)」をリリースしたのです。

Fooocus派生モデル「Fooocus-MRE」で、前述の画像からi2iを使って別画像を生成したところ。メタデータも作成されている

 追加機能としてimage2imageの機能のサポートと、ControlNetの一部サポート、さらにメタデータの入力機能を備えたものです。

 MoonRide303さんは、Fooocusが「ジェネレーティブ・アートへの最初の一歩を踏み出そうとしているカジュアル・ユーザーにとって使いやすいシンプルなUI」を備えていることを絶賛しつつも、「lllyasvielさんがステップ、サンプラー、スケジューラーなどの設定などの基本的な機能まで外してしまった」と述べています。そのうえで、「Fooocusの元々のバージョンで私が必要だと思った基本的な機能を実装することにしました。Fooocus-MREは同じ哲学を貫き、できるだけシンプルに保ちたい」としています。

 Fooocusのソースコードは公開されているため、誰でも派生モデルを開発できます。Stable Diffusionを巡る開発環境も多くが公開されているため、他のアプリのソースを参照することにより、こうしたことができてしまうのです。確かに、Fooocus-MREの方が、すでに画像生成AIについて一定の知識を持つ人にとっては、使いやすい面もあります。今後、本家のFooocusとFooocus-MREがどのような発展のプロセスをたどっていくのかは注目されていくでしょう。

カテゴリートップへ

この連載の記事
ピックアップ