なぜベースモデルの作例はいまいちに見えるのか
SDXLやFLUXなど、最新のベースモデルの作例を見て「意外と普通だな」と感じた人も多いだろう。生成AIの性能がここまで進化したのに、公式デモの画像がどこか物足りなく見える――そんな印象を受けるのは無理もない。
その理由のひとつは、プロンプト(指示文)の作り込み不足だ。ベースモデルはあくまで汎用的に設計されており、適当なテキスト入力だけでは個性や雰囲気を引き出しにくい。だが、より本質的な理由は別にある。
ほとんどのクリエイターが日常的に使っているのは、ベースモデルそのものではなく、特定の作風や人物・質感を学習させたチェックポイント(Checkpoint)だ。チェックポイントは、ベースモデルを基盤として追加訓練を行った派生モデルのことで、アニメ調、写真調、ファッション撮影風など、多様な表現に特化している。
つまり、一般に公開されるベースモデルの作例は「素材」としての状態を示しているに過ぎず、実際のクリエイティブ現場では、その上にLoRAやCheckpointを重ねて“自分のテイスト”を作り上げているというわけだ。これを理解すると、生成AIの世界が一気に奥深く見えてくるだろう。
その他の注目モデル
「Stable Diffusion 3.5(2024年10月リリース)」は技術的には大きな進歩を遂げたが、初期のライセンス問題による信頼失墜と、高いVRAM要件(SD3.5 Largeは20GB以上必要)により、コミュニティでの受容は限定的となっている。
「PixArt-Σ(PixArt-Sigma)」は0.6億パラメータの軽量モデルながら4K解像度対応を実現し、8GB未満のVRAMでも動作する効率性が評価されている。
「Kandinsky 3.x」は119億パラメータを持つロシア発のモデルで、多言語対応とApache 2.0ライセンスが特徴。ただし日本語コミュニティでの情報は少ない。
ライセンス問題に注意
画像生成AIモデルを使用する際は、ライセンスに注意が必要だ。
Stable Diffusion 1.5やSDXL 1.0は比較的寛容なオープンソースライセンスで公開されており、商用利用も可能だ。
しかしStable Diffusion 3シリーズでは、2024年6月のリリース時に制限的なライセンス(商用利用制限、月間生成枚数制限)が設定され、コミュニティから強い批判を受けた。その後「Stability AI Community License」に修正されたが(年間収益100万ドル未満は商用利用無料)、この一連の騒動によりStability AIへの信頼は大きく損なわれた。
一方、「FLUX.1 [schnell]」はApache 2.0ライセンス(最も自由度の高いオープンソースライセンス)を採用しており、完全に商用利用可能だ。
商用利用を検討している場合は、必ず各モデルの最新ライセンス情報を確認することをおすすめする。

この連載の記事
-
第35回
AI
ここがヤバい!「Nano Banana Pro」画像編集AIのステージを引き上げた6つの進化点 -
第33回
AI
初心者でも簡単!「Sora 2」で“プロ級動画”を作るコツ -
第32回
AI
【無料】動画生成AI「Wan2.2」の使い方 ComfyUI設定、簡単インストール方法まとめ -
第31回
AI
“残念じゃない美少女イラスト”ができた! お絵描きAIツール4選【アニメ絵にも対応】 -
第30回
AI
画像生成AI「Midjourney」動画生成のやり方は超簡単! -
第29回
AI
創作のプロセスを激変させる画像生成AI「Midjourney V7」の使い方 ドラフトモード、パーソナライズ機能に大注目 -
第28回
AI
ローカル動画生成AIの革命児「FramePack」の使い方 -
第27回
AI
【解説】Geminiの画像生成がすごい 無料で使えるうちに試してみて -
第26回
AI
人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク 初心者にオススメ -
第25回
AI
業界トップ級の画像生成AIツール「Recraft」 Adobeユーザーは体験する価値あり - この連載の一覧へ





