このページの本文へ

前へ 1 2 3 次へ

Stable Diffusion入門 from Thailand 第7回

秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話

2024年01月03日 10時00分更新

文● 田口和裕

　美少女画像を生成しようと思い立ち7月にゲーミングPCを購入してからはや半年、当初の目標であった画像生成にはなんとか成功したものの、とにかくこのジャンルは進化が早い。苦労して新しい技術を使えるようになったと思ったらすぐに次のとんでもない技術が登場し、以前のものは古くなっていく。なんとか振り落とされないようについていくのがやっとだが、それでも猛烈におもしろく刺激的な半年間だった。

「Stream Diffusion」爆誕

StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました！！
sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます！

多分これが一番速いと思います pic.twitter.com/4qleR2isW1
— あき先生 / Aki (@cumulo_autumn) December 6, 2023

　さて、前回はStable Diffusionを爆速化するLCM系ツールについて解説したのだが、実はその執筆中となる12月6日に上記のツイートが投下された。

　内容は気になったものの、この時点ではまだソースも公開されていなかったため連載には取り上げなかった。

大変お待たせしました！本日arXivにて公開された私達の論文「StreamDiffusion」について
GitHubリポジトリの方も公開しました！100fps以上出すことも可能です！
詳しくは論文、リポジトリのREADMEをご確認ください！#StreamDiffusion
論文:https://t.co/4zQKFyPKgj
GitHub:https://t.co/U1ufvRR9cq https://t.co/5hO1UXT4Ya
— あき先生 / Aki (@cumulo_autumn) December 21, 2023

　だが、それからわずか2週間後、12月21日にはStable Diffusionがオープンソースで全公開された。さっそく速報記事を執筆、試してみようとしたのだが環境構築がちょっと大変そうだなと数日グズグズしていたら……。

　なんと開発者のひとり「あき先生」による懇切丁寧なインストールガイドが12月23日深夜に生配信されたのだ。これにガッツリ参加してアドバイスもいただきつつそれでもかなり苦労したがようやくなんとか動かすことができた。さっそく見ていこう。なお、筆者の環境はグラフィックボードがNVIDIA GeForce RTX4070（12GB）、CPUがCore i7-13700、内蔵メモリーは48GBだ。

まずはGit clone

　ここからしばらく環境構築およびインストールの話しが続くので、興味のない方は2ページ目の実行編へ。

　まずはGitHubのStream Diffusionレポジトリにアクセス。

　日本語で書かれた詳細なREADMEが用意されているのでインストールも敷居が低そうだ（と、最初は思った）。

　まずは、下記コマンドでローカルに環境をクローンする。

git clone https://github.com/cumulo-autumn/StreamDiffusion.git

　Dドライブのルートにレポジトリをクローンしているところ。

仮想環境の構築

　次にAnaconda、pip、Dockerのいずれかで仮想環境を構築する。

conda create -n streamdiffusion python=3.10 conda activate streamdiffusion

　筆者はAnacondaを利用しているので上記コマンドで仮想環境を作成。

　作成したら忘れずにアクティベートも。

VSCode

　なお、あき先生の配信にならい、ターミナルでの作業はすべてVSCodeを使用している。

PyTorchのインストール

　次はメタが開発した機械学習ライブラリー「PyTorch」のインストールだが、ここで問題が発生。StreamDiffusionではPyTorchをGPUで動作させるために、あらかじめNVIDIAの「CUDA」プラットフォームおよび「cuDNN」ライブラリーのインストールが必要なのだ。

　CUDAはGPUの種類によって11.8系と12.1系が存在する。ここではCUDA Toolkit Archiveから12.1.1をインストールした。

　続けてcuDNNをダウンロード。CUDAのバージョンによってファイルが異なるので注意が必要だ。

　準備ができたらPytorchのインストールだ。こちらもCUDAのバージョンによってインストールコマンドが異なる。

pip3 install torch==2.1.0 torchvision==0.16.0 xformers --index-url https://download.pytorch.org/whl/cu121

　CUDA 12.1系のインストールコマンドは上記。

　無事PyTorchのインストールが完了した。あと少しだ！！

StreamDiffusionのインストール

pip install streamdiffusion[tensorrt]

　最後にStream Diffusion本体をインストール。

python -m streamdiffusion.tools.install-tensorrt
pip install pywin32

　続けてTensorRT拡張およびpywin32モジュールをインストール。これで準備はすべて完了だ。

　以上、比較的スムーズに進んでいるように読めただろうが、実はめちゃくちゃ苦労している。特にCUDA、cuDNNまわりは情報収集をサボっていたため理解するのが難しく、主にChatGPTでいろいろ質問しながらなんとか準備を完了した。4時間くらいはかかっただろうか。

　もちろんこれはひとえに筆者の乏しい知識のせいだ。プログラムに慣れている人ならものの30分で上記工程をスムーズに終えることができるだろう。とはいえ初心者にとって環境設定は本当にハードルが高い。ChatGPTがなければたぶん投げ出していただろう。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年04月29日

AI

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ
2024年04月15日

AI

画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも
2024年04月08日

AI

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」
2024年04月05日

AI

AI検索「Perplexity」がかなり便利だったので紹介します
2024年04月08日

AI

3Dアニメーション技術の革新が止まらない
2024年04月24日

AI

マイクロソフト最新SLM「Phi-3」　メタ「Llama 3」あっさり抜く
2024年03月13日

AI

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」
2024年04月22日

AI

日本語対応の画像生成AI、東京発のSakana AIが発表　既存モデルより10倍高速
2024年04月12日

AI

ChatGPT、有料版で「GPT-4 Turbo」が利用可能に。LLM評価ツールも無償提供
2024年03月22日

AI

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ

ピックアップ

sponsored
有線/2.4GHz/Bluetoothを選べるトリプルモード接続＆クリック音アリナシも選択可能

我が家の「深夜うるさい問題」を解決する静音ワイヤレスゲーミングマウス「ED-G3MPRO」
sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
購入しやすい価格ながら機能充実、バッテリー長持ちの人気製品

1万円以下ウェアラブルの大定番がさらに進化！睡眠モニタリング精度アップの「HUAWEI Band 9」レビュー
sponsored
eスポーツ大会で採用される24インチクラスの新モデル

180Hzで3万円切りの即買いモデル、スピーカー内蔵のゲーミングディスプレー「G255PF E2」レビュー
sponsored
新たな敵は地中から現れる！

さらなる刺客（シカク）が四角い地球を襲う！5月23日発売『デジボク地球防衛軍２（略）』の魅力をチェック
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか
sponsored
大阪・泉州産のスウェット生地を採用した「AKRacing by BEAMS DESIGN モデル」

スウェット生地のチェアってどう？編集部員何人かに座った感想を聞いてみた
sponsored
セブンアールジャパンの西川氏とASRockの原口氏にコダワリを聞いてきた

パソコンショップSEVENとASRockのコダワリが炸裂！ Threadripper PRO 7995WX搭載BTOPC
sponsored
従来よりもさらにコスパよくゲーミングPCを組みたい方へ

ゲーミングマザーボード「GAMING PLUS」シリーズ完全解説＆自作のオススメ構成例も紹介
sponsored

BaaS普及を追求し続けるGMOあおぞらネット銀行と、ARIのAWS導入支援cnarisに迫る
sponsored
強化ガラス製マウスパッド「ROG Moonstone」など気になるデバイスもまとめて試す！

静音性重視の独自スイッチ“ROG NX Snow”がイイ！「ROG Strix Scope II 96 Wireless」をレビュー