インテル Arcで画像生成系AI入門!設定方法とパフォーマンス検証でArc×生成AIを解説
提供: ASRock/テックウインド
「インテル Arc Aシリーズ」(以下、インテル Arc)は2022年の発売以降、ドライバーのアップデートを繰り返し、性能を高めている。昨年末に掲出した、ASRock製インテル Arc搭載ビデオカードの検証記事(https://ascii.jp/elem/000/004/177/4177741/)では、ゲームにおいての性能アップも確認できた。
一方で、昨今のGPUはゲームを快適に遊ぶためだけのものではない。特に最近は、GPUメーカー自身が画像生成系AIで自社のGPUが使えるかをアピールするようになった。この分野ではCUDAが利用できるNVIDIAのGeForceの情報量が多いが、インテル Arcではその辺りのパフォーマンスはどうなのだろうか?
本稿では、インテル ArcでStable Diffusionを楽しみたい方のための“とっかかり”を紹介したい。日進月歩で状況は変化しているし、筆者もインテル Arcを利用した画像生成系AIのすべてを知っているわけではないため、見逃している事もあるかもしれないが、インテル Arcで画像生成系AIを使いたい人の参考になれば幸いだ。
ASRock製インテル Arcカードで検証する
本稿執筆にあたり、ASRockよりインテル Arcの現行モデル(Arc A310〜A770 16GB)を上から下までお借りした。ビデオカードについての詳細は、前述したドライバー別の検証記事を参照してほしい。
検証環境は以下の通りとなる。画像生成系AIの分野ではGPUに搭載されている演算器の数とVRAM搭載量の両方が重要であるため、エントリー寄りのA380やA310の性能はあまり期待できない。
これらのGPUは動画エンコード(特にAV1)分野での活用するとよいだろう。今回の注目はVRAM 8GB対決(A580/A750/A770)と、VRAM 16GBを搭載したA770がどの程度違うか、という点にある。
【検証環境】 | |
---|---|
CPU | インテル「Core i9-14900K」 (24コア/32スレッド、最大6GHz) |
CPUクーラー | 簡易水冷、360mmラジエーター |
マザーボード | ASRock「Z790 Nova WiFi」(Intel Z790、ATX、BIOS 4.05) |
メモリー | Micron「CP2K16G56C46U5」(16GB×2、DDR5-5600) |
ストレージ | Corsair「CSSD-F1000GBMP600」(1TB M.2 SSD、PCIe 4.0) |
ビデオカード | ASRock「Intel Arc A770 Phantom Gaming 16GB OC」(16GB GDDR6)、 ASRock「Intel Arc A770 Phantom Gaming 8GB OC」(8GB GDDR6)、 ASRock「Intel Arc A750 Challenger D 8GB OC」(8GB GDDR6)、 ASRock「Intel Arc A580 Challenger 8GB OC」(8GB GDDR6)、 ASRock「Intel Arc A380 Challenger ITX 6GB OC」(6GB GDDR6)、 ASRock「Intel Arc A310 Low Profile 4GB」(4GB GDDR6) |
電源ユニット | Super Flower「LEADEX PLATINUM SE 1000W-BK」 (1000W、80PLUS Platinum) |
OS | Microsoft「Windows 11 Pro」(23H2) |
Stable Diffusionの環境構築解説やパフォーマンス検証の前に、今回用意したビデオカードがどの程度のパフォーマンスであるか、定番の「3DMark」を使って確認しておこう。
描画パフォーマンスにおいてはA770の16GB版と8GB版では大きな差はみられないが、微妙に16GB版のほうがスコアーが高い。GPUのクロックはどちらも2.2GHzだが、16GB版のほうがより高速なGDDR6を使用している(17.5Gbps vs 16Gbps)ためだ。
それより下のインテル ArcについてはほぼGPUスペック通りの序列になっているが、A580とA380の間に大きな性能ギャップがある点にも注目したい。A580に搭載されているXeコアは24基なのに対しA380は8基、回路規模にして1/3しかない。これだけのスペック差があれば、ここまでの性能差が出るのも当然といえる。
続いては「UL Procyon」の“AI Inference Benchmark for Windows”を利用し、GPUを利用した推論処理の性能を見ておこう。APIはWindows ML、推論デバイスはGPU、計算精度はFP32とした。
こちらの傾向も3DMarkとほぼ変わらない。推論回数のグラフでは一部下位GPUが逆転している部分も見られる(珍しくはない)が、総じて上位モデルのほうが同時間内の推論回数も多くなる。こちらでもエントリークラスのA380やA310の推論回数は、A580以上のインテル Arcに比べて明らかに少ない。これだけでも画像生成系AIにおけるA380やA310のポジションがなんとなく分かってくるだろう。