Stable Diffusionを代表とする画像生成AIにおいて、生成スピードを上げるにはより強力なGPUが必要だ。GeForceならRTX 4090のような最強のGPUが使えればいいが、誰もが手にできる価格とは言い難い。
となればビデオカードを複数枚使用してStable Diffusionの生成スピードが向上しないだろうか? と考えるのは自然な流れだが、今のStable Diffusionは複数のGPUを協調させて処理する機能は搭載されていない。
しかし、Stable Diffusion(とAutomatic 1111)をGPUごとに紐付けて起動することで、ビデオカードの数だけ並行して作業を進めることができる。玄人志向の製品紹介ページには、まさにそういった記述が存在する。
玄人志向公式サイトの製品紹介ページには、複数のビデオカードを使うとStable Diffusionの生成速度がほぼ倍になるというデータが示されている。本稿はこれが本当かどうかを確かめる目的もあるのだ
そこで今回は、玄人志向製のGeForce RTX 4070 SUPER搭載カード「GALAKURO GAMING GG-RTX4070SP-E12GB/DF」およびRTX 4070 Ti SUPER搭載カード「GALAKURO GAMING GG-RTX4070TiSP-E16GB/EX/TP」を2枚ずつ用意。Stable Diffusionを2GPU環境で動かし、本当にパフォーマンスが向上するかを検証してみた。
Stable Diffusionのセットアップが手軽に行なえる「StableMatrix」を利用した環境構築についても概要を解説するので、ビデオカード1枚の環境でも通用する。
玄人志向「GALAKURO GAMING GG-RTX4070SP-E12GB/DF」を2枚お借りした。最近のビデオカードは大きくて重いが、このカードはデュアルファン&2スロット厚なので複数枚挿し運用がしやすい。実売価格は1枚あたり9万8000円前後
「GPU-Z」でカードの情報をチェック。2枚挿ししているので左下のメニューに2基のRTX 4070が認識されていることが分かる。RTX 30シリーズからSLIはサポートされなくなったため、2枚挿ししてもSLIは常にDisabledとなる
さらに玄人志向「GALAKURO GAMING GG-RTX4070TiSP-E16GB/EX/TP」も2枚お借りした。実売価格は1枚あたり13万7000円前後
RTX 4070 Ti SUPERの強みはVRAM搭載量がRTX 4070の12GBよりも多い16GBであることだ。たった4GBの差だが、より高解像度の出力を得るにはVRAM搭載量は命だからだ
ビデオカード枚数の上限は電源ユニットとスロットの配置で決まる
今回はあえて同じGPU型番で2枚そろえているが、SLIのような協調動作ではないため異なる型番でも動作に問題はない。RTX 4070 Ti SUPERとRTX 3060というアンバランスな組み合わせでも問題はない。複数枚挿しする場合は電源ユニットの容量と補助電源ケーブルの本数、そしてマザー側のx16スロットの本数に制約を受ける。
今回RTX 4080より上のGeForceにしなかった理由は、RTX 4080より上だと8ピン×3が最低限必要になるため(2枚だと×6が必要)だ。そして最近のATXマザーだとM.2スロット数確保のためにx16スロットを2本しか持たないものが多いし、複数スロットを消費するカードだと厚みの干渉という問題もある。
ライザーケーブルやx1スロットをx16スロットに引き出す変換ケーブルを使えばスロット数制限は打開できるが、今度は仮想通貨マイニングで使われるようなビデオカード専用ラックが必要になる。
カード全長は238mmと(今時のビデオカードにしては)大人しめのサイズ感。だが複数枚挿して冷却も確保することを考えると、このくらいがちょうどいいだろう
カード裏側。バックプレートの後部には通気口が設けられている
2スロット厚であれば大抵のATXマザーにおいてカード同士の干渉を気にせず装着できるはずだ。映像出力端子の構成はスタンダードなDisplayPort×3+HDMI×1構成
補助電源は16ピン。2系統の8ピンケーブルから変換するケーブルが付属する
カード後部のスイッチの操作により、カード上部のGeForceロゴに仕込まれた白色LEDの発光を強制オフにすることが可能
GALAKURO GAMING GG-RTX4070TiSP-E16GB/EX/TPはより強力なRTX 4070 Ti SUPERを搭載しているため、カードは全長323mm×全高131mmとかなり大柄になった。「WINGS 2.0」なる口径102mmのファンを3基搭載。ブレード全体がRGB LEDでライトアップされる
カード後方はファンの気流を裏側に通すために通気口があるのが今風のデザインだが、この製品の通気口は特に大きい。通気口付近の強度が心配だが、バックプレートをL字構造にすることで剛性を確保している
カードはジャスト3スロット厚
補助電源は16ピン。8ピンの補助電源ケーブル×2本を16ピンに変換して使用する
カード裏側にあるこの端子は、テスターのプローブを当てて各部の電圧などを直接計測するためのもの。ガチのオーバークロックをする人向けの装備だ
今時のATXマザーでは3スロット厚がギリギリ入れられる厚みの限界。RTX 4070 Ti SUPERより上になると補助電源ケーブルの本数が足らなくなるため、電源ユニット自体も複数必要になるだろう