最新パーツ性能チェック 第381回
購入前に押さえておきたいRTX 40シリーズの新機能も解説
GeForce RTX 4090基本ベンチ&解説編!Fire Strike UltraはRTX 3090から93%アップ!?
2022年10月11日 22時00分更新
AIがフレームを自動補間する新世代のDLSS
③“CPUボトルネック”を緩和しフレームを生成する「DLSS Frame Generation」
RTX 40シリーズにおける最大のみどころはDLSS 3で追加されるDLSS Frame Generation、日本語で言えば「DLSSフレーム生成」への対応だ。これに伴い従来のDLSSはDLSS Super Resolutionと呼ばれることになった。DLSS Super Resolutionは引き続きRTX 20〜30シリーズでも利用可能だが、DLSS Frame GenerationはRTX 40シリーズ専用となる。「DLSS 3」とは、DLSS Frame Generationを含むDLSS実装を示す呼び名だ。
DLSS Frame Generationの前にDLSS Super Resolutionについて解説しておくと、低解像度のレンダリングから高解像度かつ高画質の出力画像を得る超解像処理を行う機能だ。Tensorコアを利用したAI処理により実現する。DLSS Super ResolutionでGPUの負荷が劇的に下がるため、ゲームのフレームレート向上に大きな効果が得られるが、CPUがGPUに描画を指示しなければ効果が得られない。もしCPUの処理がモタついて、GPUに描画指示を出すのが遅れれば、フレームレートは上がらない。いわゆる「CPUバウンド」の状態になる。
この状況を打破するのがDLSS Frame Generationとなる。DLSS Frame Generationでは前フレームと今フレームの情報から、今フレームと次フレームの中間フレームをGPUだけで推測して出力する。仮にCPUがフレーム0、1、2、3、4……と描画指示を出した場合、フレーム0と1から0.5を、1と2から1.5を生成する。
DLSS Frame Generationは特にCPUバウンド(=CPUが律速)の状態で効果を発揮するが、これは即ちCPUのパフォーマンスが低いほどDLSS Frame Generationの効果も期待できることを意味する。レイトレーシングのように重い処理で効果を発揮するが、DLSS Frame Generationの動作にレイトレーシングは必須ではない。
DLSS Frame Generationを使うことで、同じフレームレートでもGPUのシェーダー負荷を減らせる点も大きなメリットだ。例えばDLSS Super ResolutionのPerformanceモードでは、出力解像度の縦横半分の解像度(面積にして1/4)でレンダリングされるが、これにDLSS Frame Generationを適用すると、最初の1フレームとFrame Generationで挿入される次のフレームのすべてがAIによって描画されることになる。理論上、1のシェーダー負荷で8の仕事ができる計算になる(実際はそう上手くは行かないだろうが)。
このDLSS Frame Generationの推論処理において必要なのが、あるフレームにおいて動いていないピクセルの判定だ。これを処理するのがRTX 40シリーズに搭載されたオプティカルフローアクセラレーターだ。
オプティカルフローについてざっと解説しておくと、時間的に連続した2枚の画像を比較し、各ピクセルの光学的な動きから動きのベクトルを算出するというもので、「Adobe Premiere Pro」をはじめ、動画編集系ソフトではお馴染みのフレーム補間技法となる。DLSS Super Resolutionで言うところのモーションベクターはゲーム内世界でのオブジェクトの動き、オプティカルフローは画面に投影された映像の動きと言い換えられる。
このオプティカルフローアクセラレーターの存在が、DLSS Frame GenerationがRTX 40シリーズ以降でしか使えない理由になる。オプティカルフローで画面を光学的に分析して初めて、破綻の少ないフレーム生成が可能になるのだ。もちろん推測による生成であるため、激しく動く物体がある場合は形状が乱れるなどの制約はあるが、ゲームにおけるCPUボトルネックを打破する手段としては非常に有用といえる。
ただ、常に場面の正確な動きを認識する必要があるeスポーツ性の高いゲーム(VALORANTやApex Legends等)では、推論によって描画するDLSS Frame Generationとは相性が良くないのではと感じる人もいるはずだ。
しかし、そういったゲームではそもそも描画が軽いものが多く、DLSS Frame Generationが必須になるとは考えにくい。もしDLSS Frame Generationが実装されていても、使わなければ済む話だ。
④NVEncはAV1に対応。さらに2つ並列で動作可能
RTX 40シリーズではGPUに搭載されたハードウェアエンコーダー「NVEnc」がAV1に対応した。先鞭を付けたのは先日登場した「インテル Arc A380 グラフィックス」だが、今回はレビュー用に「DaVinci Resolve Studio 18」やDiscordのβビルドも提供されたため、実践的なパフォーマンスの検証もできた。DaVinci Resolve Studio 18に関しては別稿で検証結果をお目にかけたい。
さらに、NVEncは2基搭載され、2基のNVEncを並列で動かせるようになった。Pascal〜Volta世代(GeForce GTX 1070〜Titan V)ではすでに複数のNVEncを備えたモデルが存在するが、並列で動かせるのはAda Lovelace以降とのことだ。「OBS Studio」の最新ビルドではデュアルNVEncに対応しており、エンコーダーにNVEncを指定するだけで自動的に並列処理となる。ただ、今回試した限りではNVEncの片方だけを使用するような指定はできなかったので、2基同時利用が前提と考えられる。
この連載の記事
-
第458回
自作PC
Arc B580のRTX 4060/RX 7600超えは概ね本当、11本のゲームで検証してわかった予想以上の出来 -
第457回
自作PC
インテル新GPU、Arc B580の実力は?AI&動画エンコードは前世代より超強力に -
第456回
デジタル
「Ryzen 7 9800X3D」は高画質設定でも最強ゲーミングCPUであることに間違いはなかった -
第455回
デジタル
「Ryzen 7 9800X3D」が最強ゲーミングCPUであることを証明する -
第454回
デジタル
性能が最大50%引き上げられたSamsung製SSD「990 EVO Plus」は良コスパSSDの新星だ -
第453回
デジタル
性能も上がったが消費電力も増えた「Ryzen 7 9800X3D」最速レビュー、AI推論の処理速度は7800X3Dの約2倍! -
第452回
自作PC
Core Ultra 200Sシリーズのゲーム性能は?Core Ultra 5/7/9を10タイトルで徹底検証 -
第451回
自作PC
Core Ultra 9 285K/Core Ultra 7 265K/Core Ultra 5 245K速報レビュー!第14世代&Ryzen 9000との比較で実力を見る -
第450回
デジタル
AGESA 1.2.0.2でRyzen 9 9950Xのパフォーマンスは改善するか? -
第449回
デジタル
Ryzen 9000シリーズの性能にWindows 11の分岐予測改善コードはどう影響するか? -
第448回
デジタル
TDP 105W動作にするとRyzen 7 9700X/Ryzen 5 9600Xはどの程度化ける? レッドゾーン寸前を攻める絶妙な設定だが、ゲームでの効果は期待薄 - この連載の一覧へ