このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第35回

誰でも使える、誰にも覗かれない

画像生成AIに“表現の自由”を スーパーハッカーが挑んだ「Fooocus」

2023年09月04日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

Fooocusの画面から「girl」で生成した直後。スタート画面では本当に設定項目がほぼない(画像は筆者生成)

 Stability AIは7月27日、2週間遅れで「Stable Diffusion XL 1.0(SDXL)」をリリースしました。現在、SDXLに対応した動作環境として主要なものとしては「WebUI(A1111版)」、「ComfyUI」の2つがあり、このうちComfy UIの対応が早かったため人気になっています。Stablity AIでは「StableSwarmUI」というWebUIの公式版といった形の動作環境を作っていて、ComfyUIとの統合を進めています。

 その一方、SDXLが出てきたことでWebUI、ComfyUI、StableSwarmUIはだんだん導入のハードルが上がってきてしまいました。事前に設定しなければならない要素が多く、求められる専門知識が着実に上がっているためです。また、これまでのStable Diffusion 1.5との混在環境であることも相まって、UIが分かりにくなりました。SDXL向けの「ControlNet」機能も登場しつつありますが、SDXLの特徴である2段階生成をさせない方がうまくいくといったケースも出てきており、ますますわかりにくい。ビデオメモリーなどスペックの要求も高く、初心者にはSDXLは、最初のとっつきが悪いという印象になっていました。

 8月12日に、そこに突如あらわれてきた新たな選択肢が「Fooocus」。作者はControlNetを開発した、あのlllyasvielさん(チャン・リュミンさん)です(「画像生成AIに2度目の革命を起こした『ControlNet』」参照)。

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ