Stable Diffusionを代表とする画像生成AIにおいて、生成スピードを上げるにはより強力なGPUが必要だ。GeForceならRTX 4090のような最強のGPUが使えればいいが、誰もが手にできる価格とは言い難い。
となればビデオカードを複数枚使用してStable Diffusionの生成スピードが向上しないだろうか? と考えるのは自然な流れだが、今のStable Diffusionは複数のGPUを協調させて処理する機能は搭載されていない。
しかし、Stable Diffusion(とAutomatic 1111)をGPUごとに紐付けて起動することで、ビデオカードの数だけ並行して作業を進めることができる。玄人志向の製品紹介ページには、まさにそういった記述が存在する。
そこで今回は、玄人志向製のGeForce RTX 4070 SUPER搭載カード「GALAKURO GAMING GG-RTX4070SP-E12GB/DF」およびRTX 4070 Ti SUPER搭載カード「GALAKURO GAMING GG-RTX4070TiSP-E16GB/EX/TP」を2枚ずつ用意。Stable Diffusionを2GPU環境で動かし、本当にパフォーマンスが向上するかを検証してみた。
Stable Diffusionのセットアップが手軽に行なえる「StableMatrix」を利用した環境構築についても概要を解説するので、ビデオカード1枚の環境でも通用する。

玄人志向「GALAKURO GAMING GG-RTX4070SP-E12GB/DF」を2枚お借りした。最近のビデオカードは大きくて重いが、このカードはデュアルファン&2スロット厚なので複数枚挿し運用がしやすい。実売価格は1枚あたり9万8000円前後

「GPU-Z」でカードの情報をチェック。2枚挿ししているので左下のメニューに2基のRTX 4070が認識されていることが分かる。RTX 30シリーズからSLIはサポートされなくなったため、2枚挿ししてもSLIは常にDisabledとなる
ビデオカード枚数の上限は電源ユニットとスロットの配置で決まる
今回はあえて同じGPU型番で2枚そろえているが、SLIのような協調動作ではないため異なる型番でも動作に問題はない。RTX 4070 Ti SUPERとRTX 3060というアンバランスな組み合わせでも問題はない。複数枚挿しする場合は電源ユニットの容量と補助電源ケーブルの本数、そしてマザー側のx16スロットの本数に制約を受ける。
今回RTX 4080より上のGeForceにしなかった理由は、RTX 4080より上だと8ピン×3が最低限必要になるため(2枚だと×6が必要)だ。そして最近のATXマザーだとM.2スロット数確保のためにx16スロットを2本しか持たないものが多いし、複数スロットを消費するカードだと厚みの干渉という問題もある。
ライザーケーブルやx1スロットをx16スロットに引き出す変換ケーブルを使えばスロット数制限は打開できるが、今度は仮想通貨マイニングで使われるようなビデオカード専用ラックが必要になる。
