ゲームのスクショ、プレイ動画の編集におすすめ
AMD Radeon、AIバッチリ使えます:Adobe PhotoshopやPremiere Proで検証
2024年06月28日 11時00分更新
AMD RDNA 3アーキテクチャーのGPU「Radeon RX 7000」シリーズは、GPUダイ(Graphics Compute Die)とキャッシュメモリーダイ(Memory Cache Die)を組み合わせた「チップレットアーキテクチャー」という革新的な仕組みを採用している点が大きな特徴だ。そして、中でもお買い得感に優れる「Radeon RX 7800 XT」(以下、RX 7800 XT)は、120基ものAI処理向けアクセラレーター「AI Accelerator」を搭載している点にも注目したい。しかし、このAI Acceleratorについて、どんな効果があるのか疑問に思っている人も多いことだろう。実はAI AcceleratorではAI処理の高速化が可能なのだが、実際にはどの程度なのか。RX 7800 XTでさまざまアプリのAI機能を実行し、AI Acceleratorの活用方法を模索してみたい。
3840基のStream Processorに加えて
120基のAI Acceleratorを搭載
まずは、RX 7800 XTについてまとめておこう。
RX 7800 XTは、冒頭でも述べた通り、RDNA 3アーキテクチャーに基づくGPUだ。RDNA 3では、AMDが「Stream Processor」(以下、SP)と呼ぶシェーダープロセッサーを16基でひとまとめにして実行ユニットとしている。そのうえで、4基の実行ユニットとレジスタファイルなどを合わせ「Compute Unit」(以下、CU)を構成し、そのCUを2つ組み合わせて「Dual Compute Unit」(以下、Dual CU)としている。RX 7800 XTでは、このCUを60基、Dual CUであれば30基有しているので、SPの総数は16(SP)×4(実行ユニット)×60(CU)で3840基となる計算だ。そして、RDNA 3アーキテクチャーでは、今回の主役であるAI Acceleratorは、1基のCUにつき2基が組み合わされる構造となっているため、RX 7800 XTに用意されたAI Acceleratorの総数は120基となる。
このAI Acceleratorは行列演算に特化したもので、競合NVIDIAにおける「Tensorコア」に相当するものという理解で問題ない。AI Acceleratorは、32bit SIMD積和算器である「Wave Matrix Multiply Accumulate」(以下、WMMA)を64基搭載しており、それぞれがFP16における2要素の積和算に対応しているため、RX 7800 XTにおけるAI Acceleratorのスループットは、ブースト最大動作クロックが2430MHzであることを加味すると、74.65TFLOPSということになる。ちなみに、上記のASRock製カードであれば、ブースト最大クロックが2520MHzに引き上げられているため、AI Acceleratorのスループットも77.41TFLOPSに向上している。
そんなRX 7800 XTの主なスペックを前世代の「Radeon RX 6800 XT」(以下、RX 6800 XT)とともにまとめたものが以下の表だ。RX 7800 XTとRX 6800 XTとでは、AI Acceleratorの有無が大きい違いになっているが、それ以外にも、グラフィックスメモリーに16GBと大容量のGDDR6を搭載し、新しいキャッシュシステムである「Infinty Cache」を64MB合わせ持つことで、実効メモリーバス帯域幅が2708.4GB/sとかなり向上している点もトピックと言える。
RX 7800 XT | RX 6800 XT | |
---|---|---|
GPUコア | Navi 32 XT | Navi 21 XT |
GPUアーキテクチャー | RDNA 3 | RDNA 2 |
製造プロセス技術 | 5nm GCD+6nm MCD | 7nm |
トランジスタ数 | 281億 | 268億 |
ダイサイズ | 200mm2(GCD)150mm2(MCD) | 520mm2 |
演算ユニット数 | 60基 | 72基 |
シェーダプロセッサー数 | 3840基 | 4608基 |
レイトレーシングユニット数 | 60基 | 72基 |
AI Accelerators | 120基 | - |
テクスチャユニット数 | 240基 | 288基 |
ROP数 | 96基 | 128基 |
ゲームクロック | 2124MHz | 2015MHz |
ブースト最大クロック | 2430MHz | 2250MHz |
Infinity Cache容量 | 64MB | 128MB |
メモリータイプ | GDDR6 | GDDR6 |
メモリーインタフェース | 256bit | 256bit |
メモリークロック | 19.5Gbps | 16Gbps |
メモリーバス帯域幅 | 624GB/s | 512GB/s |
メモリー容量 | 16GB | 16GB |
Toatal Board Power | 263W | 300W |
接続インタフェース | PCIe 4.0 | PCIe 4.0 |
PCIe外部電源 | 8ピン×2 | 8ピン×2 |