このページの本文へ

Stable Diffusion入門 from Thailand 第34回

無料で始める画像生成AI 人気モデルとツールまとめ【2025年11月最新版】

2025年11月07日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

Stable Diffusion 1.5

リリース:2022年10月

 Stable Diffusion 1.5は、画像生成AIをローカル環境で動かせるようにした先駆的なモデルだ。512×512ピクセルの画像生成に対応し、約8億パラメータという比較的コンパクトなサイズが特徴だ。

特徴:

・必要VRAM:4GB〜8GB(推奨8GB)
・生成解像度:512×512ピクセルが最適
・豊富な派生モデル:写実系、イラスト系など多数のチェックポイントがコミュニティで公開されている
・軽量で動作が速い

現在の位置づけ:

2025年現在では最新モデルに性能面で劣るものの、軽量さと豊富な派生モデルの存在により、低スペックPCでの利用や特定用途では依然として価値がある。

アニメ系

実写系

SDXL 1.0

リリース:2023年7月

 SDXL(Stable Diffusion XL)1.0は、Stable Diffusionの大幅な進化版として登場した。35億パラメータのベースモデルと66億パラメータのリファイナーモデルという2段階構成により、高品質な画像生成を実現している。

特徴:

・必要VRAM:12GB以上推奨(8GBでも起動オプションで動作可能だが実用性は低い)
・生成解像度:1024×1024ピクセルが最適
・2段階生成:ベースモデルで基本的な画像を生成後、リファイナーで細部を精緻化
・細部の描写力とリアリズムが大幅に向上

現在の位置づけ:

2025年11月現在でも最も安定した選択肢として多くのユーザーに利用されている。豊富なコミュニティモデルとLoRA(Low-Rank Adaptation)、拡張機能のエコシステムが確立されており、実用性が高い。

アニメ系

実写系

FLUX.1

リリース:2024年8月

 FLUX.1は、Stable Diffusionの元開発メンバーが設立したBlack Forest Labsによる最新モデルだ。120億パラメータを持ち、フロートランスフォーマー・アーキテクチャとRectified Flow技術を採用している。

特徴:

・必要VRAM:12GB以上(量子化により8GBでも動作可能)
・生成解像度:4K対応
・革新的な品質:DALL-E 3やMidjourney v6.0を上回るプロンプト遵守性
・テキスト描画能力と人物の手足描画精度で革命的な改善

モデルバリエーション:

・FLUX.1 [schnell]:Apache 2.0ライセンスで商用利用完全自由。高速生成に対応
・FLUX.1 [dev]:非商用利用向け。研究・実験用途
・FLUX.1 [pro]:最高品質。API経由での商用利用向け

現在の位置づけ:

 2024年8月のリリース以降、業界標準を塗り替える存在となっている。特に[schnell]版は完全にオープンなライセンスで、高品質な画像生成が可能なため、今後の主流になる可能性が高い。

量子化技術(GGUF形式):

FLUX.1は量子化技術により、VRAM要件を大幅に削減できる。
・FP16完全版:24GB VRAM必要
・Q8量子化:13GB VRAM
・Q6量子化:12GB VRAM
・Q4量子化:8GB VRAM

 Q6以上であれば実質的な画質劣化はほとんどなく、8GB VRAMでも実用的な画像生成が可能になった。

アニメ系

実写系

カテゴリートップへ

この連載の記事
ピックアップ