ロードマップでわかる!当世プロセッサー事情 第716回
Radeon Pro W7900/W7800が異様に安い価格で投入される理由 AMD GPUロードマップ
2023年04月24日 12時00分更新
4月14日、AMDはRadeon Pro W7900とRadeon Pro W7800の2製品を発表した。内容は発表記事にあるとおりで、基本Navi 31ベース、つまりRadeon RX 7900 XT/XTXをベースにしながら、多少動作プロファイルを変更し、かつRadeon Pro Driverでの検証を行なった「だけ」で、あまり新しい話はない。
もっとも発表資料を仔細に見るといろいろ突っ込みどころはあり、中の人も苦労したんだなぁというのが良くわかるが、それは後で説明するとして、まず触れたいのはRadeon Pro W7800の方である。
Radeon Pro W7800の性能は
GeForce RTX 4070 Tiと同程度か少し上
| Radeon Pro W7900とW7800のスペック | ||||||
|---|---|---|---|---|---|---|
| Radeon Pro W7900 | Radeon Pro W7800 | Radeon RX 7900XTX | Radeon RX 7900XT | |||
| Shader Engine数 | 6 | 5(推定) | 6 | 6 | ||
| CU数 | 96 | 70 | 96 | 84 | ||
| SP数 | 6144 | 4480 | 6144 | 5376 | ||
| MCD数 | 6 | 4 | 6 | 5 | ||
| InfinityCache | 96MB | 64MB | 96MB | 80MB | ||
| MemoryBus | 384bit | 256bit | 384bit | 320bit | ||
| Peak FP32性能 | 61.3TFlops | 45.2TFlops | 61.3TFlops | 52TFlops | ||
| Boost周波数 | 2.5GHz(推定) | 2.5GHz(推定) | 2.5GHz | 2.4GHz | ||
| TGP/TBP | 295W | 260W | 355W | 315W | ||
上表がRadeon Pro W7900とW7800のスペック一覧である。W7900の方はほぼNavi 31のフルスペックと考えて良い。ほぼRadeon RX 7900XTXをそのまま、といったところだ。Boost周波数は、Peak FP32の性能が同じ61.3TFlopsになっていることから、こちらは2.5GHzのままと考えられる。
ただRadeon RX 7900XTXのTBP(Typical Board Power)は355Wなのに対し、Radeon Pro W7900のTGP(Typical Graphics Power)が295Wなのは、Power Profileを操作してTypicalで295Wに収まるように調整しているものと考えられる。
実際Radeon RX 7900XTXの場合、標準でPower Limitは-10%~+15%で、つまりTBPは319.5~408.3Wほどの範囲になっている。ただここでPower Limitを-17%程度まで拡大すれば295Wに収まる計算だ。ワークステーション用途が主とは言え、場合によっては3U程度のシャーシに収めてラックに格納、ということも考えられるから、300Wの枠は守りたかったものと思われる。
次にW7800の動作周波数だが、ピークのFP32の演算性能が45.2TFlopsと説明されており、W7900とのCU数の比からこちらもほぼ2.5GHzのままと想像される。それでもCU数が大幅に減っている分、消費電力はCU数に比例して下がることが期待される。
CU数の比で計算すると、Radeon Pro W7800のTGPは215Wまで下がる計算であり、実際は260Wと比較的余裕があることを考えると、Power ProfileそのものはRadeon Pro W7800の方がやや高めに設定されているものと考えられる。
ところで構成であるが、非常におもしろい。もともとNavi 31は6つのShader Engineを搭載しており、各々のShader Engineに16個づつのCUが搭載されるという構図だった。
ではRadeon Pro W7800は? というと70CUになるので、必要となるShader Engineの数は70÷16=4.375で、4つでは足りず5つ必要とになる。
6つのままという可能性もあるが、70で割り切るのは面倒(72CUなどだったらあり得たかもしれない)だし、Shader Engineをまるまる1個無効化できるから、歩留まり向上の意味でも効果的ではあるとは思う。かつ、5つのShader Engineの16CUのうち2CUを無効化し、14CU×5=70CUという構成にしている。図にすると下のようになる。
この構成がおもしろいと思うのは、MCDは4つしかないことだ。メモリーバスはMCDあたり64bitなので、256bitメモリーということはMCDは4つという計算になる。またインフィニティ・キャッシュの容量も64MBとされており、ここからもMCDは4つとはっきりわかる。
なにがおもしろいかというと、このバランスで性能が出ていることだ。最初筆者はMCDは5つで、ただしそのうちGDDR6を接続しない形で、単にインフィニティ・キャッシュだけを使っているのかと思った。実際Shader Engineが6つにMCDが6つでバランスしてるなら、Shader Engineが5つならばMCDも5つ必要だと考えるのは普通だろう。ところが実際には4つでバランスする、というのは意外にインフィニティ・キャッシュの効率が良いということになる。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ















