このページの本文へ

前へ 1 2 3 次へ

Stable Diffusion入門 from Thailand 第7回

秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話

2024年01月03日 10時00分更新

文● 田口和裕

　美少女画像を生成しようと思い立ち7月にゲーミングPCを購入してからはや半年、当初の目標であった画像生成にはなんとか成功したものの、とにかくこのジャンルは進化が早い。苦労して新しい技術を使えるようになったと思ったらすぐに次のとんでもない技術が登場し、以前のものは古くなっていく。なんとか振り落とされないようについていくのがやっとだが、それでも猛烈におもしろく刺激的な半年間だった。

「Stream Diffusion」爆誕

StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました！！
sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます！

多分これが一番速いと思います pic.twitter.com/4qleR2isW1
— あき先生 / Aki (@cumulo_autumn) December 6, 2023

　さて、前回はStable Diffusionを爆速化するLCM系ツールについて解説したのだが、実はその執筆中となる12月6日に上記のツイートが投下された。

　内容は気になったものの、この時点ではまだソースも公開されていなかったため連載には取り上げなかった。

大変お待たせしました！本日arXivにて公開された私達の論文「StreamDiffusion」について
GitHubリポジトリの方も公開しました！100fps以上出すことも可能です！
詳しくは論文、リポジトリのREADMEをご確認ください！#StreamDiffusion
論文:https://t.co/4zQKFyPKgj
GitHub:https://t.co/U1ufvRR9cq https://t.co/5hO1UXT4Ya
— あき先生 / Aki (@cumulo_autumn) December 21, 2023

　だが、それからわずか2週間後、12月21日にはStable Diffusionがオープンソースで全公開された。さっそく速報記事を執筆、試してみようとしたのだが環境構築がちょっと大変そうだなと数日グズグズしていたら……。

　なんと開発者のひとり「あき先生」による懇切丁寧なインストールガイドが12月23日深夜に生配信されたのだ。これにガッツリ参加してアドバイスもいただきつつそれでもかなり苦労したがようやくなんとか動かすことができた。さっそく見ていこう。なお、筆者の環境はグラフィックボードがNVIDIA GeForce RTX4070（12GB）、CPUがCore i7-13700、内蔵メモリーは48GBだ。

まずはGit clone

　ここからしばらく環境構築およびインストールの話しが続くので、興味のない方は2ページ目の実行編へ。

　まずはGitHubのStream Diffusionレポジトリにアクセス。

　日本語で書かれた詳細なREADMEが用意されているのでインストールも敷居が低そうだ（と、最初は思った）。

　まずは、下記コマンドでローカルに環境をクローンする。

git clone https://github.com/cumulo-autumn/StreamDiffusion.git

　Dドライブのルートにレポジトリをクローンしているところ。

仮想環境の構築

　次にAnaconda、pip、Dockerのいずれかで仮想環境を構築する。

conda create -n streamdiffusion python=3.10 conda activate streamdiffusion

　筆者はAnacondaを利用しているので上記コマンドで仮想環境を作成。

　作成したら忘れずにアクティベートも。

VSCode

　なお、あき先生の配信にならい、ターミナルでの作業はすべてVSCodeを使用している。

PyTorchのインストール

　次はメタが開発した機械学習ライブラリー「PyTorch」のインストールだが、ここで問題が発生。StreamDiffusionではPyTorchをGPUで動作させるために、あらかじめNVIDIAの「CUDA」プラットフォームおよび「cuDNN」ライブラリーのインストールが必要なのだ。

　CUDAはGPUの種類によって11.8系と12.1系が存在する。ここではCUDA Toolkit Archiveから12.1.1をインストールした。

　続けてcuDNNをダウンロード。CUDAのバージョンによってファイルが異なるので注意が必要だ。

　準備ができたらPytorchのインストールだ。こちらもCUDAのバージョンによってインストールコマンドが異なる。

pip3 install torch==2.1.0 torchvision==0.16.0 xformers --index-url https://download.pytorch.org/whl/cu121

　CUDA 12.1系のインストールコマンドは上記。

　無事PyTorchのインストールが完了した。あと少しだ！！

StreamDiffusionのインストール

pip install streamdiffusion[tensorrt]

　最後にStream Diffusion本体をインストール。

python -m streamdiffusion.tools.install-tensorrt
pip install pywin32

　続けてTensorRT拡張およびpywin32モジュールをインストール。これで準備はすべて完了だ。

　以上、比較的スムーズに進んでいるように読めただろうが、実はめちゃくちゃ苦労している。特にCUDA、cuDNNまわりは情報収集をサボっていたため理解するのが難しく、主にChatGPTでいろいろ質問しながらなんとか準備を完了した。4時間くらいはかかっただろうか。

　もちろんこれはひとえに筆者の乏しい知識のせいだ。プログラムに慣れている人ならものの30分で上記工程をスムーズに終えることができるだろう。とはいえ初心者にとって環境設定は本当にハードルが高い。ChatGPTがなければたぶん投げ出していただろう。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2025年02月17日

AI

月3万円で使えるOpenAIの「Deep Research」　驚異的だが、情報格差が広がる不安も感じた
2025年01月27日

AI

動画生成AI、ついにアダルトの扉が開く
2025年02月24日

AI

AI生成の3Dデータが実用レベルに近づいてきた
2025年02月14日

AI

完全無料！話題のDeepSeek R1をローカルで動かしてみた。MacやスマホでもOK！
2025年02月06日

AI

「DeepSeek」コード内にユーザーデータを中国政府に送信する機能か　米メディア報道
2025年02月26日

AI

ChatGPT「Deep Research」月額3万円→3000円でも使えるように
2025年02月25日

データセンター

伸びしろしかない成長株　新興外資系と地方の注目データセンター4選
2025年02月14日

ビジネス

トランシーバーアプリ「LINE WORKSラジャー」提供開始　AIで文字と声の垣根を越える
2025年02月27日

AI

アマゾン、AI強化版「アレクサ＋」　プライム会員は無料
2025年02月05日

AI

孫正義会長がAIの“水晶玉”に見た、iPhone独占販売に近い「勝ちパターン」

102554

ピックアップ

sponsored
脅威の検知だけでなく対処までを自動化　「FortiEDR」で運用負荷の課題をクリア

EDRが発したアラートへの対応が遅れ、100GB超の情報漏洩！どうやったら防げた？
sponsored

自分なら80型のテレビよりこっち！　手軽に4K高画質と100インチ越えを狙うなら「N1S 4K」だ
sponsored
プランも機能差もたくさんあって迷ってしまうあなたのために

お得なのはどれ？ Backlog有料プランの分かりやすい選び方ガイド
sponsored
Dropboxも自社で活用　営業から人事、総務まで幅広く使える最新ツール

送った資料はしっかり読んでもらえたか？気になるそこを追跡できる「Dropbox DocSend」
sponsored
パソコンショップSEVENの「ZEFT Z55EU」について、中の人に聞いてきた

価格を抑えたいけど、ゲームがしっかり動くか不安という人はこれ！ゲーム性能高くコスパも重視したゲーミングPC
sponsored

価格7万円以下で買える！どこにでも置ける小型PC「GEEKOM A6」はパワフルで使い勝手◎
sponsored
MSI「Modern 14 F1M」レビュー

日本のビジネスワークをしっかり把握したCore 7ノートパソコン、1.5kgで入出力端子も充実、プレゼン用に180度開閉でコスパ抜群
sponsored
JN-DMD-IPS156Fをレビュー

2画面モバイルディスプレー2台で夢の5画面環境！ノートPCでも生産性爆上がり間違いなし
sponsored
尊師スタイルもOKで、CHERRY MX ウルトラロープロファイルスイッチがメロい

例の極薄65％メカニカルキーボードがBT化して完全体に！「Mistel AIRONE RGB BT」最速レビュー
sponsored
「なんとなく」でも割とどうにかなるのでご安心を！

ちょっと世界の王になってくるわ…『シドマイヤーズシヴィライゼーションVII』は奥深いけど初心者でもイケるストラテジーゲームの新定番だ！
sponsored
iiyama キャンパスPCの「STYLE-14FH124-i5-UC1X-CP25」をチェック

これが私の学生時代にあれば……と思える11万円台・4年保証・1kg以下の14型ノートPC、24時間365日サポートもうれしい
sponsored
JN-IPS238G180FHDをレビュー

モンハンワイルズのオトモに最適!? 180Hz＆2万円切りのGEO限定ゲーミングモニターでひと狩りいこうぜ！
sponsored
MSI「MPG B850 EDGE TI WIFI」レビュー

白いマザーボードでは異質なほどゲーミング寄りデザインのAMD B850搭載モデルは貴重な存在
sponsored
フォーティネットのエキスパートに聞く、今情シスにAIが必要な理由

エキスパートは隣にいる　情シスエンジニアの成長を促すFortiAI
sponsored
AI学習向け／AI推論向けデータセンターとネットワーク、コンサルティングまでサービス提供

生成AI特化のデータセンターもまとめて提供　オプテージの“AIデータセンター戦略”
sponsored
音質、ノイズキャンセリング、デザインと、ファーウェイの最先端技術を凝縮！

ファーウェイの技術の粋を集めた最上位イヤホン「HUAWEI FreeBuds Pro 4」レビュー
sponsored

たった６万円で不満なし！ディスプレイとキーボード、マウスまで一括で揃う“高コスパ”オールインワンPC「Lenovo A100」で勉強や仕事の効率アップ
sponsored
大阪市内で2026年1月に運用開始する“コネクティビティデータセンター”、注目を浴びる背景やターゲットを聞く

クラウド時代に選ばれるデータセンターへ　オプテージ「曽根崎データセンター」はネットワークへの接続性が強み
sponsored
31.5インチQD-OLEDパネルの4Kモデルに新色！MSI「MPG 321URXW QD-OLED」レビュー

ホワイトゲーミングPCに高機能なホワイトディスプレーを組み合わせたら神環境になった話
sponsored
JN-QOLC49G144DQ-HSC9Lをレビュー

【めちゃ綺麗！】サムスンディスプレイ製量子ドット有機ELパネルがスゴイ32:9ディスプレー、発色・色再現性よくゲームに役立つ機能も豊富！
sponsored
サムスンディスプレイ製パネル採用ウルトラワイド「JN-QOLC49G144DQ-HSC9L」の魅力に迫る

サムスンディスプレイ製QD-OLEDパネルは何がスゴイ？ポイントは白なしRGBのみで色を再現している点
sponsored
JN-IPS2380UHDR-C65W-HSPをレビュー

実は超レアな23.8型4Kディスプレー、USB Type-C給電・KVM・昇降式多機能スタンドで約4.2万円はコスパ激強
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！