最新パーツ性能チェック 第381回
購入前に押さえておきたいRTX 40シリーズの新機能も解説
GeForce RTX 4090基本ベンチ&解説編!Fire Strike UltraはRTX 3090から93%アップ!?
2022年10月11日 22時00分更新
AIがフレームを自動補間する新世代のDLSS
③“CPUボトルネック”を緩和しフレームを生成する「DLSS Frame Generation」
RTX 40シリーズにおける最大のみどころはDLSS 3で追加されるDLSS Frame Generation、日本語で言えば「DLSSフレーム生成」への対応だ。これに伴い従来のDLSSはDLSS Super Resolutionと呼ばれることになった。DLSS Super Resolutionは引き続きRTX 20〜30シリーズでも利用可能だが、DLSS Frame GenerationはRTX 40シリーズ専用となる。「DLSS 3」とは、DLSS Frame Generationを含むDLSS実装を示す呼び名だ。
DLSS Frame Generationの前にDLSS Super Resolutionについて解説しておくと、低解像度のレンダリングから高解像度かつ高画質の出力画像を得る超解像処理を行う機能だ。Tensorコアを利用したAI処理により実現する。DLSS Super ResolutionでGPUの負荷が劇的に下がるため、ゲームのフレームレート向上に大きな効果が得られるが、CPUがGPUに描画を指示しなければ効果が得られない。もしCPUの処理がモタついて、GPUに描画指示を出すのが遅れれば、フレームレートは上がらない。いわゆる「CPUバウンド」の状態になる。
この状況を打破するのがDLSS Frame Generationとなる。DLSS Frame Generationでは前フレームと今フレームの情報から、今フレームと次フレームの中間フレームをGPUだけで推測して出力する。仮にCPUがフレーム0、1、2、3、4……と描画指示を出した場合、フレーム0と1から0.5を、1と2から1.5を生成する。
DLSS Frame Generationは特にCPUバウンド(=CPUが律速)の状態で効果を発揮するが、これは即ちCPUのパフォーマンスが低いほどDLSS Frame Generationの効果も期待できることを意味する。レイトレーシングのように重い処理で効果を発揮するが、DLSS Frame Generationの動作にレイトレーシングは必須ではない。
DLSS Frame Generationを使うことで、同じフレームレートでもGPUのシェーダー負荷を減らせる点も大きなメリットだ。例えばDLSS Super ResolutionのPerformanceモードでは、出力解像度の縦横半分の解像度(面積にして1/4)でレンダリングされるが、これにDLSS Frame Generationを適用すると、最初の1フレームとFrame Generationで挿入される次のフレームのすべてがAIによって描画されることになる。理論上、1のシェーダー負荷で8の仕事ができる計算になる(実際はそう上手くは行かないだろうが)。
このDLSS Frame Generationの推論処理において必要なのが、あるフレームにおいて動いていないピクセルの判定だ。これを処理するのがRTX 40シリーズに搭載されたオプティカルフローアクセラレーターだ。
オプティカルフローについてざっと解説しておくと、時間的に連続した2枚の画像を比較し、各ピクセルの光学的な動きから動きのベクトルを算出するというもので、「Adobe Premiere Pro」をはじめ、動画編集系ソフトではお馴染みのフレーム補間技法となる。DLSS Super Resolutionで言うところのモーションベクターはゲーム内世界でのオブジェクトの動き、オプティカルフローは画面に投影された映像の動きと言い換えられる。
このオプティカルフローアクセラレーターの存在が、DLSS Frame GenerationがRTX 40シリーズ以降でしか使えない理由になる。オプティカルフローで画面を光学的に分析して初めて、破綻の少ないフレーム生成が可能になるのだ。もちろん推測による生成であるため、激しく動く物体がある場合は形状が乱れるなどの制約はあるが、ゲームにおけるCPUボトルネックを打破する手段としては非常に有用といえる。
ただ、常に場面の正確な動きを認識する必要があるeスポーツ性の高いゲーム(VALORANTやApex Legends等)では、推論によって描画するDLSS Frame Generationとは相性が良くないのではと感じる人もいるはずだ。
しかし、そういったゲームではそもそも描画が軽いものが多く、DLSS Frame Generationが必須になるとは考えにくい。もしDLSS Frame Generationが実装されていても、使わなければ済む話だ。
④NVEncはAV1に対応。さらに2つ並列で動作可能
RTX 40シリーズではGPUに搭載されたハードウェアエンコーダー「NVEnc」がAV1に対応した。先鞭を付けたのは先日登場した「インテル Arc A380 グラフィックス」だが、今回はレビュー用に「DaVinci Resolve Studio 18」やDiscordのβビルドも提供されたため、実践的なパフォーマンスの検証もできた。DaVinci Resolve Studio 18に関しては別稿で検証結果をお目にかけたい。
さらに、NVEncは2基搭載され、2基のNVEncを並列で動かせるようになった。Pascal〜Volta世代(GeForce GTX 1070〜Titan V)ではすでに複数のNVEncを備えたモデルが存在するが、並列で動かせるのはAda Lovelace以降とのことだ。「OBS Studio」の最新ビルドではデュアルNVEncに対応しており、エンコーダーにNVEncを指定するだけで自動的に並列処理となる。ただ、今回試した限りではNVEncの片方だけを使用するような指定はできなかったので、2基同時利用が前提と考えられる。
この連載の記事
-
第439回
自作PC
暴れ馬すぎる「Core i9-14900KS」、今すぐ使いたい人向けの設定を検証! -
第438回
デジタル
中国向け「Radeon RX 7900 GRE」が突如一般販売開始。その性能はWQHDゲーミングに新たな境地を拓く? -
第437回
自作PC
GeForce RTX 4080 SUPERは高負荷でこそ輝く?最新GeForce&Radeon15モデルとまとめて比較 -
第436回
デジタル
環境によってはGTX 1650に匹敵!?Ryzen 7 8700G&Ryzen 5 8600Gの実力は脅威 -
第435回
デジタル
VRAM 16GB実装でパワーアップできたか?Radeon RX 7600 XT 16GBの実力検証 -
第434回
自作PC
GeForce RTX 4070 Ti SUPERの実力を検証!RTX 4070 Tiと比べてどう変わる? -
第433回
自作PC
GeForce RTX 4070 SUPERの実力は?RTX 4070やRX 7800 XT等とゲームで比較 -
第432回
自作PC
第14世代にもKなしが登場!Core i9-14900からIntel 300まで5製品を一気に斬る -
第431回
デジタル
Zen 4の128スレッドはどこまで強い?Ryzen Threadripper 7000シリーズ検証詳報 -
第430回
デジタル
Zen 4世代で性能が爆上がり!Ryzen Threadripper 7000シリーズ検証速報 -
第429回
自作PC
Core i7-14700Kのゲーム性能は前世代i9相当に!Raptor Lake-S Refreshをゲーム10本で検証 - この連載の一覧へ