GeForce RTXシリーズの
アーキテクチャーを大予想
さて、ここまでは前座でいよいよ本命のGeForce RTXシリーズである。実のところ、こちらもまだ詳細はわかっていない。意識してのことだとは思われるが、NVIDIAはまだTuringアーキテクチャーに関するホワイトペーパーなどを公開しておらず、なのでRT Coreの実装や、SM(Streaming Multiprocessor)がどういう構造になっているのかはさっぱりわからない。
あるいはNVIDIAが新しく公開したRTX-OPSという指標も、なにをどうやるとこの78T RTX-OPSが算出されるのか不明なままである。
このあたりは今後製品が出荷されるころまでに明らかにされることを期待しつつ、とりあえずイッペイ氏の記事に示されたスペックを基にロードマップを描き直したのが下図である。
CUDAコア数こそ明らかになっているが、その他の話は今のところ未公開なので、これらは全部推定(なので数字には“?”がついている)である。この推定の根拠を説明しよう。
下の画像はNVIDIA提供の、TU102コアのダイ写真である。ちなみにTU102、というコード名も公式にはまだ明らかにされていない。今までだとGTになりそうだが、あいにくGTシリーズはすでに使われている。あるいはRTXシリーズでR、TuringでTということでRT102、なんて話も出ていたが、TU102というのが一番確度は高いらしい。
それはともかくこのTU102の内部ブロックを見ると、大きく6つのブロックがあり、それぞれの中に6行4列の演算ユニットがある。これを6行4列とみるか12行4列とみるかは難しいが、後述の理由により6行4列の方が辻褄が合いやすいので、6行4列案を取る。
TU102コア(Quadro RTX 8000)は6つのクラスターがあり、それぞれのクラスターが24個のSMを持ち、各々のSMが32演算(Intの場合)を同時に処理すると考えると、CUDAコア総数は6×24×32=4608となり、Quadro RTX 8000の4608 CUDAコアというスペックに合致することになる。
問題はGeForce RTXである。GeForce RTX 2080 Tiの場合、コアそのものは間違いなくTU102のままであると思われる。ただしCUDAコアが4352という、謎な数字になっているが、これを6クラスター/32演算で割ると、1クラスターあたり22.6667……SMになる。ただこれも実際には簡単で、1クラスターあたり23SMコアにしつつ、うち2クラスターのみ22SMにすれば、6クラスター合計で136SM、4352CUDAコアになる。
ちなみにテクスチャーユニットはPascal世代の製品構成を睨みつつ、一応クラスターあたり48ユニットと仮定してみた。一方ROPについては、メモリーコントローラ(32bit)あたり10ユニットと仮定している。
この結果、GeForce RTX 2080Tiは6クラスターなのでテクスチャーユニットは288ユニット、一方ROPユニットは352bit Bus(32bit×11ch)でメモリーチャネルが11個なので、110ユニットとしている。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











