DLSSとは違い対応ハードウェアが多いのがFSRのメリット
元画像と出力画像であるが、FSRはUltra Quality/Quality/Balanced/Performanceという4つのモードがあり、説明によれば以下のようになっている。
FSRにある4つのモード | ||||||
---|---|---|---|---|---|---|
Ultra Quality | 元画質に非常に近い品質の画像が得られる。最高の品質を求める場合に選択。 | |||||
Quality | 元画質に匹敵する品質の画像を、大幅な性能向上を図りながら生成。 | |||||
Balanced | 元画質に近い品質の画質を生成。更に大幅な性能向上をもたらす。 | |||||
Performance | 画質への影響が大きいので、性能向上が不可避な場合にのみ選択。 |
6月29日追記
記事初出後、NVIDIAより連絡をいただいた。いわく、昨年3月に発表されたDLSS 2.0では利用できる解像度の制限がなくなり、またQuality/Balanced/Performance/(一部タイトルでは)Ultra Performanceの画質モードが選択できるとのこと。
確認したところ、筆者の手持ちのタイトルで言えばMetro Exodus PC Enhanced Editionでは確かに解像度の制限がなくなり、画質も選べるようになっていたことをお詫びして訂正する。
とは言え、初代DLSSを実装しているタイトルはいまだに解像度制限があり、また画質も固定のままである(筆者が手持ちの例で言えばShadow of the Tomb Raiderとか)。なので、新しいタイトルに関して言えば解像度/品質に関して言えばDLSSとFSRで差はないが、古いタイトルだとやや不便なままであることに変わりはない。
こう感覚的に言われてもピンとこないと思うので、それぞれの設定を見ると以下の形になる。
4つのモードの拡大率 | ||||||
---|---|---|---|---|---|---|
Ultra Quality | 1.3倍拡大 | |||||
Quality | 1.5倍拡大 | |||||
Balanced | 1.7倍拡大 | |||||
Performance | 2倍拡大 |
これはX軸なりY軸方向の寸法の倍率であって、面積比で言うならば下表になる。
4つのモードの面積比 | ||||||
---|---|---|---|---|---|---|
Ultra Quality | 1.69倍拡大 | |||||
Quality | 2.25倍拡大 | |||||
Balanced | 2.89倍拡大 | |||||
Performance | 4倍拡大 |
GPUの負荷はこの面積に比例するわけで、Ultra Qualityだと描画69%アップ、Performanceだと4倍になるが、実際はそこまで性能が伸びるわけではない。4つ前のQuality Settingの画像に戻ると、これはQuality Modeでの動作である。最終の出力解像度は4Kということなので、入力画像は2560×1440ピクセルになる。
まずFSRを使わずに4K出力した場合、Radeon RX 6800 XTでのフレームレートは92fpsほどになる。これを2560×1440ピクセルに下げると179fpsになる。フレームレートは2倍弱に向上した形だ。これを単に1.5倍表示にする「だけ」ならこれ以上フレームレートは下がらないが、実際には画像補完の処理が入る。
これもGPUのシェーダーを使って処理する関係で、この分のオーバーヘッドが加わり、10fpsほど下がった169fpsほどになる。つまりFSRを利用すると、それなりのオーバーヘッドが発生するのは間違いない。ただしそれを上回る性能向上があるので、差し引きすると大幅な性能改善となるわけだ。
もう1つ、FSRがDLSSと大きく異なるのは、「動作するカードがはるかに多い」ことだ。DLSSの場合はTensor Coreを利用するがゆえに自社の、それもGeForce RTX系列でないと使えないという制約につながったが、FSRはアルゴリズム実装で、しかもGPU Openに沿った形で実装されており、少なくともDLSSに比べるとはるかにポータビリティーが高い。
実際Radeon RXシリーズのみでなく、GeForce GTX 1060でも動作するとされている。筆者もGeForce GTX 1660とRyzen Pro 7 4750Gの内蔵GPUで動作することを確認している。
下の画像が現時点でFSRが対応しているGPUの一覧である。GeForce GTX 1000シリーズやRadeon RX 400シリーズは2016年の発表である。さすがにこれより古い製品のサポートはないが、まぁ妥当かと思う。
原理的にはFSRが想定している構成のシェーダーを搭載していればどんな機種でも動くはずであり、Tiger Lakeに搭載されているXeなら動きそうな気はする。
ちなみにRadeon RX 6800 XTを使った場合のフレームレートの変わり方が下の画像だ。おおむねNative(つまりFSRなし)→Ultra Quality設定でフレームレートが1.5倍、Performance設定では2.5倍前後まで跳ね上がるとされている。
先ほどの面積比で言えばPerformanceならば4倍くらいになっても不思議ではないのだが、以下の問題がある。
- 描画処理は解像度がそのまま影響する部分と、解像度とは無関係な部分の両方があり、後者はFSRを使っても性能が改善しない
- FSRを利用してフレームレートが上がると、相対的にCPUの負荷が上がりやすくなる。なので十分な性能のCPUと組み合わせないと、フレームレートが頭打ちになる
さらに、先に述べた画質改善処理のオーバーヘッドもあるので、この程度なのは仕方ないだろう(というか、これでも十分高速だと思う)。
この連載の記事
-
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ