内部データパスはTuringの2倍

GeForce RTX 30-Series Tech SessionsでわかったAmpereが超進化した理由

2020年09月05日 06時00分更新

TensorコアはRTコアとの同時実行が可能に

　AmpereのTensorコアは第3世代のものが使われているが、主な強化点はスパースモデリングにも対応した、という点だ。ディープラーニングは多量の学習データが必要だが、十分な量のデータが用意できなければ役に立たない。スパースモデリングはSparse（まばらな）の意味から想像がつく通り、少ないデータから推論するための技法だ。スパースモデリングで処理をする場合、従来のデンスモデリングを使った処理よりも2倍のパフォーマンスが期待できる。ただし、このあたりで筆者の理解を超越してきたので、ここまでとしておきたい。

最初はデンスなデータでトレーニングし、枝刈り（Pruning）でスパースモデリングに移行。計算量が減るので処理が高速化できるというわけだ

Ampere（RTX 3080）のTensorコアはTuring（RTX 2080 SUPER）よりもSMあたりのコア数は減っているが、FP16の積和算が実行できる数はTuringよりも大きい。Tensorコア1基あたりで見ると、Turingが64オペレーションだが、Ampere（RTX 3080）はデンスなら128、スパースなら256オペレーションが実行できるという

　GeForce RTX 30シリーズを主にゲーミング用途で買う我々にとって、TensorコアはAIを使って低解像度のレンダリングから解像度の高いアウトプットを得る「DLSS」や、レイトレーシング時のAIデノイズ処理のためにあるコアだ。特にレイトレーシング処理をさせる場合は、RTコアとTensorコアを活用することで処理時間（フレームタイム）を短くできる、というのはTuring世代からもたらした概念だ。

　しかし、TuringではRTコアとTensorコアを同時に動かすことができないという制約を抱えていた。RTコアで処理し、しかるべき処理をした後でTensorコアに引き渡す必要があった。それに対して、Ampereではハードウェア的な改良を加えることで、RTコアとTensorコアの同時処理ができるようになった。このRTコアとTensorコアの同時処理がうまく使える程度にゲームが作り込んであれば、レイトレーシング使用時における性能低下もかなり軽減されるはずだ。今後のゲーム側の対応を注視したい。

レイトレーシングを使った1フレームをレンダリングするのに、CUDAコアだけを使うと51ミリ秒（≒19fps）かかるが、RTコアを使えば20ミリ秒（≒50fps）、RTコアとTensorコアを併用すれば12ミリ秒（≒83fps）「くらいになる」という主張

TuringではRTコアとTensorコアを使った時13ミリ秒かかるフレームが、Ampereで実行すれば7.5ミリ秒に短縮する。そして、RTコアとTensorコアの同時処理を使えば、6.7ミリ秒まで短縮するという

GeForce GTX 1080 Ti/RTX 2080/RTX 3080それぞれでレイトレーシングの処理をさせた時のフレームタイムをまとめたもの（数値の単位はミリ秒）。GeForce RTX 2080もRTX 3080もRTコアとTensorコアを使う（HW RT＋DLSS）ことでフレームタイムを劇的に短縮できるが、Ampere世代のRTX 3080はRTコアとTensorコアを同時に動かせる（＋Async）ので、Turingよりも最大1.9倍高速に処理ができる

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

ASCII倶楽部

注目ニュース

GeForce RTX 30-Series Tech SessionsでわかったAmpereが超進化した理由

TensorコアはRTコアとの同時実行が可能に

この記事の編集者は以下の記事をオススメしています

PCパーツ Titanの後釜はRTX 3090!?Ampereで驚愕の性能向上を果たしたGeForce RTX 30シリーズ発表会を振り返る

PCパーツ NVIDIAがGeForce RTX 3090/3080/3070を正式発表、2080 Ti超えの3070は499ドル～

PC Ampere採用GPU「A100」発表、Titan Aが発売される可能性も NVIDIA GPUロードマップ

自作PC RTX Voiceの超強力なノイズキャンセルはゲームプレイにどの程度影響するのか検証してみた

自作PC DLSS 2.0をレビュー、GeForce RTXの価値を爆上げするWQHD＆4K時代の救世主

PCパーツ Turingコアの構造も謎の指標「RTX-OPS」の計算方法も明らかに！徐々に見えてきたGeForce RTX 20シリーズの全貌

PCパーツ 謎の新技術「RTX IO」と「NVIDIA Reflex」とは一体何者なのか

PCパーツ GeForce RTX 3090で夢の8Kゲーミングは実現するのか？HDMI 2.1とDLSSの役目を解説

自作PC ビデオカードの消費電力を正確に計測するNVIDIAの純正キット「PCAT」と「FrameView」を解説

PCパーツ GeForce RTX 3080 Founders Edition開封の儀、独特な内部構造に迫る

YouTube 自作PCトーク『ジサトラKTU』生放送 ～Ampereスゴすぎ！GeForce RTX 3080ベンチマーク～

デジタル GIGABYTEのGeForce RTX 3080と3090は強力な3連ファン搭載クーラーでゴリゴリ冷やす！

自作PC Ampere世代のGeForce RTX 3080 FE速攻レビュー、GTX 1080の最大3倍

ビデオカード NVIDIA新型GPU「GeForce RTX 3080」の夜間販売が決定

自作PC GeForce RTX 3080 FEは4Kで輝く！RTX 2080 Ti/2080/GTX 1080とゲーム13本で徹底検証

YouTube 自作PCトーク『ジサトラKTU』生放送 ～国内最速RTX 3090 FEレビュー！8Kゲーミングを見据えた巨大で獰猛なGPUの実力を検証～

自作PC GeForce RTX 3090 FE降臨！TITAN RTX/RTX 3080 FEと8Kゲーム対決

自作PC CGや動画編集におけるGeForce RTX 3080/RTX 3090の性能を徹底検証

自作PC NVIDIA Reflexでゲームの遅延を削減！360Hz液晶でわかったFortniteやVALORANTでの効果

自作PC GeForce RTX 3070 FEレビュー！Ampere世代最強の電力性能比とRTX 2080 Ti超えを確認

ビデオカード GeForce RTX 4090/4080が発表！RTX 4090は10月12日発売で1599ドル

注目ニュース

ピックアップ

PCパーツ
Titanの後釜はRTX 3090!?Ampereで驚愕の性能向上を果たしたGeForce RTX 30シリーズ発表会を振り返る

PCパーツ
NVIDIAがGeForce RTX 3090/3080/3070を正式発表、2080 Ti超えの3070は499ドル～

PC
Ampere採用GPU「A100」発表、Titan Aが発売される可能性も　NVIDIA GPUロードマップ

自作PC
RTX Voiceの超強力なノイズキャンセルはゲームプレイにどの程度影響するのか検証してみた

自作PC
DLSS 2.0をレビュー、GeForce RTXの価値を爆上げするWQHD＆4K時代の救世主

PCパーツ
Turingコアの構造も謎の指標「RTX-OPS」の計算方法も明らかに！徐々に見えてきたGeForce RTX 20シリーズの全貌

PCパーツ
謎の新技術「RTX IO」と「NVIDIA Reflex」とは一体何者なのか

PCパーツ
GeForce RTX 3090で夢の8Kゲーミングは実現するのか？HDMI 2.1とDLSSの役目を解説

自作PC
ビデオカードの消費電力を正確に計測するNVIDIAの純正キット「PCAT」と「FrameView」を解説

PCパーツ
GeForce RTX 3080 Founders Edition開封の儀、独特な内部構造に迫る

YouTube
自作PCトーク『ジサトラKTU』生放送～Ampereスゴすぎ！GeForce RTX 3080ベンチマーク～

デジタル
GIGABYTEのGeForce RTX 3080と3090は強力な3連ファン搭載クーラーでゴリゴリ冷やす！

自作PC
Ampere世代のGeForce RTX 3080 FE速攻レビュー、GTX 1080の最大3倍

ビデオカード
NVIDIA新型GPU「GeForce RTX 3080」の夜間販売が決定

自作PC
GeForce RTX 3080 FEは4Kで輝く！RTX 2080 Ti/2080/GTX 1080とゲーム13本で徹底検証

YouTube
自作PCトーク『ジサトラKTU』生放送～国内最速RTX 3090 FEレビュー！8Kゲーミングを見据えた巨大で獰猛なGPUの実力を検証～

自作PC
GeForce RTX 3090 FE降臨！TITAN RTX/RTX 3080 FEと8Kゲーム対決

自作PC
CGや動画編集におけるGeForce RTX 3080/RTX 3090の性能を徹底検証

自作PC
NVIDIA Reflexでゲームの遅延を削減！360Hz液晶でわかったFortniteやVALORANTでの効果

自作PC
GeForce RTX 3070 FEレビュー！Ampere世代最強の電力性能比とRTX 2080 Ti超えを確認

ビデオカード
GeForce RTX 4090/4080が発表！RTX 4090は10月12日発売で1599ドル