画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力

2024年11月04日 07時00分更新

文● 新清士

ユーザー側の自由度が高いところが魅力

　そして、最新の画像生成AIの中では、利用するユーザー側の自由度が高いところが魅力です。まず、7月に改定された「コミュニティライセンス」がそのまま適応されており、研究目的の用途以外でも、年間売上100万ドル（約1億5000万円）未満の組織／個人は、商用、非商用に関係なく無料で使うことができます。その金額を超えると、個別にエンタープライズライセンスの取得が必要ですが、自己申告制です。大規模企業が使う場合のライセンス費用は明らかになっていないものの、大半のコミュニティの開発者にとって扱いやすい条件になっています。

　自由度の高さを物語るのは、ファインチューニング（微調整）のチュートリアルを出してきたことですね。SD3Mの発表時と大きく違い、ユーザーが追加学習をして、LoRAやファインチューニングモデルを公開することを歓迎するという姿勢を鮮明にしています。

　SD3.5のソースコードも、リリース直後はStablity AIのコミュニティライセンスでリリースされていたのですが、そのコードを改造して学習用プログラムなどの開発した場合、将来的にエンタープライズライセンスに切り替える必要性が生まれるため、使いにくい部分がありました。しかし、その懸念が開発者コミュニティから出たことを受け、翌日にはより自由度の高いMITライセンスへと切り替えるといった柔軟性を見せています。

　一方で、SD3Mの失敗後に大きく支持を得ているFlux.1ですが、フラッグシップモデルの「pro」のウエイトモデルは、ユーザーが直接触ることができず、devでは意図的に性能を落とされているのですが、その正確な情報は隠されています。また、独自の変数など意図的に公開されていないと思われる情報もあり、それがファインチューニング環境を効果的に整えるための障害にもなっています。

　Stablity AIは思い切った情報公開をすることで、一度は失ったユーザーコミュニティの信頼を回復し、ユーザー数を取り戻すことを目指しているのでしょう。

公開されたSD3.5L用のファインチューニングのチュートリアル（ページ）

　実際、LoRA作成の基本環境の整備が進んでいます。最も普及していると思われるLoRA作成スクリプトを開発しているkohyaさんはさっそく対応作業を進めており、すでに最初の基本的な実行環境は整いつつあります。ユーザー作成のSD3.5L用LoRAの公開も始まっています。

　動作環境（対応アプリ）ですが、一度は大きく関係がこじれたComfyUIとの関係改善も進んでいるようで、SD3の資産を活かす形で対応が完了しており、基本環境としては、ほぼ迷うことなくSD3.5を動かすことができます。ファイルサイズの大きなSD3.5を、様々なVRAM環境で動作させることができるように、ComfyUI自体に効率的なメモリ管理の仕組みが導入されているようです。そのため、VRAM12GBの環境であっても動作するようです。

筆者のA6000（VRAM 48GB）搭載PCでComfyUI上でSD3.5Lを動かしている様子。大きなVRAMを搭載しているPCでは、ComfyUIは大きめにメモリを自動で取得するようになっている。画面では26.7GBを使っている

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力

ユーザー側の自由度が高いところが魅力

この連載の記事

この記事の編集者は以下の記事をオススメしています

AI リアルすぎてキモい 動画AIの進化が止まらない

AI AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能

AI 画像生成AI「Stable Diffusion 3.5」ついに登場 「FLUX」と対決へ

AI SD3.0の汚名返上なるか？！画像生成AI「Stable Diffusion 3.5」を試してみた

AI Windowsの「ペイント」と「メモ帳」がAI対応!? もう高価な編集アプリ要らないかも

AI セイコーエプソン、「牛の体型指標評価システム」を開発 AIと深度カメラを活用

AI 都営バス、AIカメラによる乗降データ取得の実証実験を開始 11月13日から

AI あなたの作業を超効率化する、すごいAIサービス10選【2024年最新版】

AI 誰でもVTuber時代へ フェイシャルAI技術、続々登場

AI 3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成

AIオススメ記事

ピックアップ

AI
リアルすぎてキモい　動画AIの進化が止まらない

AI
AI、ついにパソコンを使えるようになってしまう　Anthropic「Claude 3.5 Sonnet」新機能

AI
画像生成AI「Stable Diffusion 3.5」ついに登場　「FLUX」と対決へ

AI
SD3.0の汚名返上なるか？！画像生成AI「Stable Diffusion 3.5」を試してみた

AI
Windowsの「ペイント」と「メモ帳」がAI対応!? もう高価な編集アプリ要らないかも

AI
セイコーエプソン、「牛の体型指標評価システム」を開発　AIと深度カメラを活用

AI
都営バス、AIカメラによる乗降データ取得の実証実験を開始　11月13日から

AI
あなたの作業を超効率化する、すごいAIサービス10選【2024年最新版】

AI
誰でもVTuber時代へ　フェイシャルAI技術、続々登場

AI
3DモデリングにAI革命の兆し　1枚のイラストから3Dデータが完成