このページの本文へ

前へ 1 2 3 4 次へ

ゲームのスクショ、プレイ動画の編集におすすめ

AMD Radeon、AIバッチリ使えます:Adobe PhotoshopやPremiere Proで検証

2024年06月28日 11時00分更新

文● 宮崎真一 編集●ASCII

提供: 日本AMD

  • この記事をはてなブックマークに追加
  • 本文印刷

 AMD RDNA 3アーキテクチャーのGPU「Radeon RX 7000」シリーズは、GPUダイ(Graphics Compute Die)とキャッシュメモリーダイ(Memory Cache Die)を組み合わせた「チップレットアーキテクチャー」という革新的な仕組みを採用している点が大きな特徴だ。そして、中でもお買い得感に優れる「Radeon RX 7800 XT」(以下、RX 7800 XT)は、120基ものAI処理向けアクセラレーター「AI Accelerator」を搭載している点にも注目したい。しかし、このAI Acceleratorについて、どんな効果があるのか疑問に思っている人も多いことだろう。実はAI AcceleratorではAI処理の高速化が可能なのだが、実際にはどの程度なのか。RX 7800 XTでさまざまアプリのAI機能を実行し、AI Acceleratorの活用方法を模索してみたい。

3840基のStream Processorに加えて
120基のAI Acceleratorを搭載

 まずは、RX 7800 XTについてまとめておこう。

 RX 7800 XTは、冒頭でも述べた通り、RDNA 3アーキテクチャーに基づくGPUだ。RDNA 3では、AMDが「Stream Processor」(以下、SP)と呼ぶシェーダープロセッサーを16基でひとまとめにして実行ユニットとしている。そのうえで、4基の実行ユニットとレジスタファイルなどを合わせ「Compute Unit」(以下、CU)を構成し、そのCUを2つ組み合わせて「Dual Compute Unit」(以下、Dual CU)としている。RX 7800 XTでは、このCUを60基、Dual CUであれば30基有しているので、SPの総数は16(SP)×4(実行ユニット)×60(CU)で3840基となる計算だ。そして、RDNA 3アーキテクチャーでは、今回の主役であるAI Acceleratorは、1基のCUにつき2基が組み合わされる構造となっているため、RX 7800 XTに用意されたAI Acceleratorの総数は120基となる。

ASRockのRX 7800 XT搭載ビデオカード「AMD Radeon RX 7800 XT Steel Legend 16GB OC」

GPU-Z(Version 2.59.0)の実行結果。ブースト最大クロックが2520MHzに引き上げられたクロックアップモデルだ

 このAI Acceleratorは行列演算に特化したもので、競合NVIDIAにおける「Tensorコア」に相当するものという理解で問題ない。AI Acceleratorは、32bit SIMD積和算器である「Wave Matrix Multiply Accumulate」(以下、WMMA)を64基搭載しており、それぞれがFP16における2要素の積和算に対応しているため、RX 7800 XTにおけるAI Acceleratorのスループットは、ブースト最大動作クロックが2430MHzであることを加味すると、74.65TFLOPSということになる。ちなみに、上記のASRock製カードであれば、ブースト最大クロックが2520MHzに引き上げられているため、AI Acceleratorのスループットも77.41TFLOPSに向上している。

 そんなRX 7800 XTの主なスペックを前世代の「Radeon RX 6800 XT」(以下、RX 6800 XT)とともにまとめたものが以下の表だ。RX 7800 XTとRX 6800 XTとでは、AI Acceleratorの有無が大きい違いになっているが、それ以外にも、グラフィックスメモリーに16GBと大容量のGDDR6を搭載し、新しいキャッシュシステムである「Infinty Cache」を64MB合わせ持つことで、実効メモリーバス帯域幅が2708.4GB/sとかなり向上している点もトピックと言える。

RX 7800 XT RX 6800 XT
GPUコア Navi 32 XT Navi 21 XT
GPUアーキテクチャー RDNA 3 RDNA 2
製造プロセス技術 5nm GCD+6nm MCD 7nm
トランジスタ数 281億 268億
ダイサイズ 200mm2(GCD)150mm2(MCD) 520mm2
演算ユニット数 60基 72基
シェーダプロセッサー数 3840基 4608基
レイトレーシングユニット数 60基 72基
AI Accelerators 120基
テクスチャユニット数 240基 288基
ROP数 96基 128基
ゲームクロック 2124MHz 2015MHz
ブースト最大クロック 2430MHz 2250MHz
Infinity Cache容量 64MB 128MB
メモリータイプ GDDR6 GDDR6
メモリーインタフェース 256bit 256bit
メモリークロック 19.5Gbps 16Gbps
メモリーバス帯域幅 624GB/s 512GB/s
メモリー容量 16GB 16GB
Toatal Board Power 263W 300W
接続インタフェース PCIe 4.0 PCIe 4.0
PCIe外部電源 8ピン×2 8ピン×2

前へ 1 2 3 4 次へ

カテゴリートップへ