前へ 1 2 3 次へ

画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた

2023年12月13日 09時00分更新

文● 田口和裕

筆者生成

　生成AIの進歩はマジで早い。Stable Diffusion関連だけでも毎日のように新規手法が発表され、せっかく身につけたスキルも数週間後には完全に時代遅れのものになっていることも珍しくはない。

　中でも、ここ最近もっとも注目されているのは「LCM」だろう。

　LCMとはLatent Consistency Model（潜在一貫性モデル）の略で、大雑把に言えば「画質を多少犠牲にすることで信じられないほど高速化」する仕組みだ。

　さらにStable Diffusion開発元の本家Stability.aiからも、LCMとは異なるが「SDXL Turbo」という高速モデルが発表された。果たしてどれほど早くなったのか、それぞれ検証してみることにする。

LCMってどういう仕組？

　とはいえこれだけでは少し雑すぎるので、もう少し詳しく説明しよう。

　Stable DiffusionはLDM（潜在拡散モデル）という仕組みをベースにしている。これは、ランダムなノイズからスタートし、ノイズを除去するステップを繰り返していくことによって徐々に最終的なデータを構築していく仕組みだ。

Step1の画像

　ステップ数は「Sampling Steps」パラメーターという形でwebUIには実装されている。上記は最初のステップの例。文字通りランダムなノイズだ。

　試しに「Sampling Steps=32」という値で生成し、各ステップの画像を見てみよう。プロンプトはシンプルに「1 girl」だ。

Step1~15

　Step6くらいまではまだノイズ混じり。Step９でようやく美少女が出現している。

Step18~32

　Step15あたりから安定し、Stepを重ねるごとにディテールアップしてきた画像だが、Step27あたりでややガチャガチャしはじめ、Step32では完全に構図が変わってしまった。Step数が多いほどよい結果を得られるとは限らないのだ。

　Step数が増えれば増えるほど生成にかかる時間も増えるため、適正なSampling Step数を指定するのは重要だ。一般的にはデフォルトの「20」周辺に設定している人が多い。筆者も20のままにしている。

　そこでLCMの話しに戻るが、LCMを使用すると画像のクオリティーを維持しつつ、Sampling Step数を8程度まで下げられるため、結果的に描画速度が劇的に高速化されるということらしい。果たしてそんなにうまくいくのだろうか。

LCM Extensionを利用する

　Stable Diffusionのインターフェース「webUI」でLCMを試すには複数の方法があるが、まずは一番手軽な拡張機能「sd-webui-lcm」を利用する方法からスタートしよう。

GitHubレポジトリのURLを入力してインストール

　webUIを起動したら、上部に表示されるタブ一覧から「Extensions」＞「Install from URL」をクリックし、一番上の「URL for extension's git repository」欄に下記のURLを入力し、「Install」をクリックする。

https://github.com/0xbitches/sd-webui-lcm

　インストールが終わったら「Installed」タブに切り替える。

「sd-webui-lcm」を確認

　「sd-webui-lcm」が追加されていることを確認したら、「Apply and restart UI」をクリックして、webUIをリスタートしよう。

　画面上部に「LCM」タブが表示されているのでクリック。デフォルトでは「LCM txt2img」が選ばれている。

　それでは、いつものようにプロンプト「1 girl」で生成してみよう。初回のみ少し時間はかかるが、2回目以降は7〜8秒（RTX4070 12GB）で生成が完了した。しかも4枚である。1枚単位の生成速度で言えば2秒を切っている！

　拡大してみたが、まあまあのクオリティだ。これはすばらしい。

Advanced Option

　画面下部の「Advanced Option」をクリックすると、詳細な設定画面が開く。画像解像度や生成枚数などをコントロールできるようだ。

　ただし、このExtensionを使う方法で現在利用可能なモデルは専用に作られた「LCM_Dreamshaper_v7」のみとなっており、基本的に似たような雰囲気の画像しか作成できなくなっているようだ。

　また、筆者の環境では「img2img」「vid2vid」を試すとエラーがでてしまった。おそらくビデオメモリーが足りないようだ。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年04月05日

AI

AI検索「Perplexity」がかなり便利だったので紹介します
2024年04月29日

AI

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ
2024年04月15日

AI

画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも
2024年04月08日

AI

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」
2024年04月08日

AI

3Dアニメーション技術の革新が止まらない
2024年04月24日

AI

マイクロソフト最新SLM「Phi-3」　メタ「Llama 3」あっさり抜く
2024年03月13日

AI

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」
2024年04月05日

AI

iPhoneで日本語のリアルタイム文字起こしができる「WhisperAX」
2024年04月22日

AI

日本語対応の画像生成AI、東京発のSakana AIが発表　既存モデルより10倍高速
2024年03月22日

AI

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ

ピックアップ

sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
購入しやすい価格ながら機能充実、バッテリー長持ちの人気製品

1万円以下ウェアラブルの大定番がさらに進化！睡眠モニタリング精度アップの「HUAWEI Band 9」レビュー
sponsored
eスポーツ大会で採用される24インチクラスの新モデル

180Hzで3万円切りの即買いモデル、スピーカー内蔵のゲーミングディスプレー「G255PF E2」レビュー
sponsored
新たな敵は地中から現れる！

さらなる刺客（シカク）が四角い地球を襲う！5月23日発売『デジボク地球防衛軍２（略）』の魅力をチェック
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか
sponsored
大阪・泉州産のスウェット生地を採用した「AKRacing by BEAMS DESIGN モデル」

スウェット生地のチェアってどう？編集部員何人かに座った感想を聞いてみた
sponsored
セブンアールジャパンの西川氏とASRockの原口氏にコダワリを聞いてきた

パソコンショップSEVENとASRockのコダワリが炸裂！ Threadripper PRO 7995WX搭載BTOPC
sponsored
従来よりもさらにコスパよくゲーミングPCを組みたい方へ

ゲーミングマザーボード「GAMING PLUS」シリーズ完全解説＆自作のオススメ構成例も紹介
sponsored

BaaS普及を追求し続けるGMOあおぞらネット銀行と、ARIのAWS導入支援cnarisに迫る
sponsored
強化ガラス製マウスパッド「ROG Moonstone」など気になるデバイスもまとめて試す！

静音性重視の独自スイッチ“ROG NX Snow”がイイ！「ROG Strix Scope II 96 Wireless」をレビュー
sponsored
LEVEL∞のゲーミングデスクトップ「LEVEL-M7A6-R77-TEX」を検証

20万円以下でこの性能は高コスパだぞ！手頃でゲームを快適に遊ぶBTOPCがほしいならコレ

画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた

LCMってどういう仕組？

LCM Extensionを利用する

この連載の記事

この記事の編集者は以下の記事をオススメしています

AI これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした

AI 画像生成AIが爆速で進化した2023年をまとめて振り返る

AI 画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。画像から画像が作れる「Image Prompt」が便利です

AI 「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

トピックス 大黒屋、AI鑑定技術を開発。チャットで査定から買取まで完結

ビジネス 「昔のインターネット」を取り戻す／生成AI革命、 残された6つの課題

AI Stable Diffusionで画像からプロンプト（呪文）を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした

ビジネス オープンAI「Sora」動画革命に衝撃／リチウム硫黄バッテリーはEVに載るか？

AI テキストが崩れない！ 画像生成AIの最新版「Stable Diffusion 3」登場

ビジネス 生成AIは雇用を奪うのか？／チップレットで新シリコンバレー目指す中国

AIオススメ記事

ピックアップ

AI
これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした

AI
画像生成AIが爆速で進化した2023年をまとめて振り返る

AI
画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。画像から画像が作れる「Image Prompt」が便利です

AI
「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

トピックス
大黒屋、AI鑑定技術を開発。チャットで査定から買取まで完結

ビジネス
「昔のインターネット」を取り戻す／生成AI革命、残された6つの課題

AI
Stable Diffusionで画像からプロンプト（呪文）を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした

ビジネス
オープンAI「Sora」動画革命に衝撃／リチウム硫黄バッテリーはEVに載るか？

AI
テキストが崩れない！画像生成AIの最新版「Stable Diffusion 3」登場

ビジネス
生成AIは雇用を奪うのか？／チップレットで新シリコンバレー目指す中国