倍精度モンスターが牙をむく
ここまでゲームの性能を中心に見てきたが、GPGPU関係の性能もチェックしておきたい。本来なら機械学習のパフォーマンスで見るべきだが、まだコンシューマー用途で機械学習のパフォーマンスを活かせるキラーソフトがないため、一般的なGPGPUベンチでの比較にとどめる。
まずは動画エンコーダー「TMPGEnc Video Mastering Works 6」でのパフォーマンスをチェックする。このソフトでは一部フィルター処理にCUDAを利用することができ、CPUだけで処理をするよりも大幅な処理時間短縮が見込める。
今回は再生時間4分50秒の4K MP4動画(ゲームプレー中の動画をGeForceのShareでキャプチャーしたもの)を1パスで変換する時間を計測する。フィルター処理は1270×720ドットへのリサイズ(Lanczos-3)、およびノイズ除去(範囲は“普通”)の2つを付与した。
エンコーダーにもGPUが使えるが、これは画質の悪いNVENCではなくx264を使用し、最終アウトプットとして720pのMP4が出力されるようにした。また、この処理をCPU(Core i7-8700K)のみで実施した場合の時間とも比較する。
CPUのみだと30分以上かかる作業も、CUDAの力を利用すれば8分台で終了できる。TITAN VはGTX 1080Tiより短時間で処理を終えられたが、GPUスペックや価格の差から期待されるほどのパフォーマンスアップには至らなかった。
こうした用途では当然ながら最適化というファクターが非常に重要なので、まだTMPGEnc側がVoltaアーキテクチャーを上手く扱えてないだけ、といえるだろう。
続いては「V-Ray Benchmark」を試す。CPU検証記事でもたびたび使用しているベンチマークだが、このベンチはCUDAのパフォーマンス計測にも利用できる。CPUとは処理の手法や使用するシーンが違うため、GPUのみで比較する。
このベンチは処理時間で結果がでるため、当然ながらグラフの短い方が速い。GTX 1080TiのOC版でも1分以上かかる処理が、TITAN Vにかかれば41秒と、大幅なパフォーマンスアップとなった。
こちらは特にTITAN Vへの対応をうたっているわけではないので、単純にアルゴリズムがTITAN Vと相性がよかったと考えられる。
ではどういった計算がTITAN Vで強いのか(演算ユニットの構成からほぼ自明だが……)を調べるために「Sandra 2017」の“GPGPU演算”テストを利用して調べてみた。
上のグラフの単位は“メガピクセル毎秒”であるため、長い方が性能が高いことになる。ここで注目なのは単精度浮動小数点(Single-Float Shaders)の処理はGTX 1080Tiからせいぜい18%しか向上していないのに対し、倍精度浮動小数点(Double-Float Shaders)では14倍以上に伸びている。TITAN VはFP64処理性能に軸足を置いたGPUであることが確認できた。
ソフトウェアがVoltaの計算力を使いこなすには、当然FP64を処理にできるだけ多く組み込む必要がある。だが残念ながらゲームでFP64はほぼ使われない。
FP32がゲームでは使い勝手がいいどころか、最近ではFP16の処理を高速化するGPU(つまりVega)すら出現している。VoltaをGeForceにするためには、TITAN Vを単純にスケールダウンしただけではダメなのだ。
もうひとつ、Sandraに収録されているGPGPU系ベンチマークのうち、GPGPUを利用した財務分析パフォーマンスの比較もしてみよう。このベンチではFP64ベースを利用して、さまざまな数値解析を行なう。この計算量を比較するというものだ。
このグラフでもバーが長い方が1秒あたりの計算量が多い。FP64モンスターであるところのTITAN Vが、GeForceに対して圧倒的なパフォーマンスを誇っているのがよくわかるだろう。
この連載の記事
-
第458回
自作PC
Arc B580のRTX 4060/RX 7600超えは概ね本当、11本のゲームで検証してわかった予想以上の出来 -
第457回
自作PC
インテル新GPU、Arc B580の実力は?AI&動画エンコードは前世代より超強力に -
第456回
デジタル
「Ryzen 7 9800X3D」は高画質設定でも最強ゲーミングCPUであることに間違いはなかった -
第455回
デジタル
「Ryzen 7 9800X3D」が最強ゲーミングCPUであることを証明する -
第454回
デジタル
性能が最大50%引き上げられたSamsung製SSD「990 EVO Plus」は良コスパSSDの新星だ -
第453回
デジタル
性能も上がったが消費電力も増えた「Ryzen 7 9800X3D」最速レビュー、AI推論の処理速度は7800X3Dの約2倍! -
第452回
自作PC
Core Ultra 200Sシリーズのゲーム性能は?Core Ultra 5/7/9を10タイトルで徹底検証 -
第451回
自作PC
Core Ultra 9 285K/Core Ultra 7 265K/Core Ultra 5 245K速報レビュー!第14世代&Ryzen 9000との比較で実力を見る -
第450回
デジタル
AGESA 1.2.0.2でRyzen 9 9950Xのパフォーマンスは改善するか? -
第449回
デジタル
Ryzen 9000シリーズの性能にWindows 11の分岐予測改善コードはどう影響するか? -
第448回
デジタル
TDP 105W動作にするとRyzen 7 9700X/Ryzen 5 9600Xはどの程度化ける? レッドゾーン寸前を攻める絶妙な設定だが、ゲームでの効果は期待薄 - この連載の一覧へ