このページの本文へ

Stable Diffusion入門 from Thailand 第34回

無料で始める画像生成AI 人気モデルとツールまとめ【2025年11月最新版】

2025年11月07日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

なぜベースモデルの作例はいまいちに見えるのか

 SDXLやFLUXなど、最新のベースモデルの作例を見て「意外と普通だな」と感じた人も多いだろう。生成AIの性能がここまで進化したのに、公式デモの画像がどこか物足りなく見える――そんな印象を受けるのは無理もない。

 その理由のひとつは、プロンプト(指示文)の作り込み不足だ。ベースモデルはあくまで汎用的に設計されており、適当なテキスト入力だけでは個性や雰囲気を引き出しにくい。だが、より本質的な理由は別にある。

 ほとんどのクリエイターが日常的に使っているのは、ベースモデルそのものではなく、特定の作風や人物・質感を学習させたチェックポイント(Checkpoint)だ。チェックポイントは、ベースモデルを基盤として追加訓練を行った派生モデルのことで、アニメ調、写真調、ファッション撮影風など、多様な表現に特化している。

 つまり、一般に公開されるベースモデルの作例は「素材」としての状態を示しているに過ぎず、実際のクリエイティブ現場では、その上にLoRAやCheckpointを重ねて“自分のテイスト”を作り上げているというわけだ。これを理解すると、生成AIの世界が一気に奥深く見えてくるだろう。

その他の注目モデル

 「Stable Diffusion 3.5(2024年10月リリース)」は技術的には大きな進歩を遂げたが、初期のライセンス問題による信頼失墜と、高いVRAM要件(SD3.5 Largeは20GB以上必要)により、コミュニティでの受容は限定的となっている。

 「PixArt-Σ(PixArt-Sigma)」は0.6億パラメータの軽量モデルながら4K解像度対応を実現し、8GB未満のVRAMでも動作する効率性が評価されている。

 「Kandinsky 3.x」は119億パラメータを持つロシア発のモデルで、多言語対応とApache 2.0ライセンスが特徴。ただし日本語コミュニティでの情報は少ない。

ライセンス問題に注意

 画像生成AIモデルを使用する際は、ライセンスに注意が必要だ。

 Stable Diffusion 1.5やSDXL 1.0は比較的寛容なオープンソースライセンスで公開されており、商用利用も可能だ。

 しかしStable Diffusion 3シリーズでは、2024年6月のリリース時に制限的なライセンス(商用利用制限、月間生成枚数制限)が設定され、コミュニティから強い批判を受けた。その後「Stability AI Community License」に修正されたが(年間収益100万ドル未満は商用利用無料)、この一連の騒動によりStability AIへの信頼は大きく損なわれた。

 一方、「FLUX.1 [schnell]」はApache 2.0ライセンス(最も自由度の高いオープンソースライセンス)を採用しており、完全に商用利用可能だ。

 商用利用を検討している場合は、必ず各モデルの最新ライセンス情報を確認することをおすすめする。

カテゴリートップへ

この連載の記事
ピックアップ