何も考えずSDXLを触りたい人に使いやすい作り
Fooocusの特徴はまず簡単なこと。
UIがとにかくシンプルで、起動画面はプロンプト入力欄だけが表示された状態。たとえば「girl」と入力するだけで生成が開始します。処理速度も爆速で、筆者の環境(NVIDIA GeForce RTX 4090)では、約30秒で2枚の画像がポンポン出てきました。これは感覚的には他のツールの2倍近い速さ。これまでのツールの「いいとこ取り」をして最適化することで、高速化を実現しているそうです。
基本サイズはSDXLの基本サイズである1024×1024ピクセルで生成。8の倍数で計算されたサイズにするときれいになるのがSDXLの特性ですが、「Advanced」のチェックボタンを押すと、最適なサイズがチャートから選べる仕組みになっています。
おもしろいのが、あらかじめプロンプトをテンプレート化してある「スタイル(Style)」機能。185種類のスタイルがあり、たとえば「アニメ(anime)」というスタイルを選んで「girl」を選ぶとアニメ調の画像が出力されます。「漫画(manga)」を選ぶと漫画調に。他に「ホラー(horror)」「かわいい(kawaii)」などのスタイルもあります。これらを選ぶだけで、girlなどの単純なプロンプトからも様々な画像が生成されます。
セッティングもすごく簡単。ファイルをダウンロードして解凍し、フォルダーの中の「run.bat」を開くだけで、必要なデータを次々にダウンロードしてくれます。初期設定で悩む必要がありません。ビデオメモリーも4GBあればOK。難しいことを考えず、プロンプトだけでSDXLを触ってみたいという人にとって使いやすい作りになっています。複雑化しつつあった画像生成AI用のツールを徹底的にシンプルにする、という開発思想が感じられます。
lllyasvielさんは、とにかく爆速でアップデートをすることで知られていますが、Fooocusもリリースから毎日3回ぐらいのペースでアップデートがされました。現在はv1.0.42で、すでに42回もアップデートされています。追加機能のひとつとして、LoRAにも対応。SDXL専用のLoRAが必要ですが、そのまま使うことができます。
一方、まだControlNetには対応していません。SDXL用のControlNetはまだ開発途上で、「Canny」や「Openpose」などの機能が登場していますが、ComfyUIなどの一部環境向けの対応にとどまっています。今後はFooocusも対応されていくでしょう。また、要望の多いハイレゾ化(解像度を引き上げる処理)はlllyasvielさんも意欲を見せているので、やはり今後対応されるものと思われます。
ただしlllyasvielさんは8月21日、「WebUI A1111 v1.6に向けた作業を進めているため、一旦アップデートを止める」とのアナウンスを出しました。WebUI A1111 v1.6はSDXLへの本格対応が予定されており、SDXL向けのControlNet対応作業に集中したいということでしょう。WebUI A1111 v1.6は8月31日に正式リリースされているため、いずれFooocusのアップデートも再開されると思われます。
この連載の記事
-
第90回
トピックス
画像生成AIで年賀状 リアルな人物も簡単に -
第89回
AI
OpenAI「Sora」残念な離陸 中国勢が飛躍する動画生成AI -
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています - この連載の一覧へ