倍精度モンスターが牙をむく
ここまでゲームの性能を中心に見てきたが、GPGPU関係の性能もチェックしておきたい。本来なら機械学習のパフォーマンスで見るべきだが、まだコンシューマー用途で機械学習のパフォーマンスを活かせるキラーソフトがないため、一般的なGPGPUベンチでの比較にとどめる。
まずは動画エンコーダー「TMPGEnc Video Mastering Works 6」でのパフォーマンスをチェックする。このソフトでは一部フィルター処理にCUDAを利用することができ、CPUだけで処理をするよりも大幅な処理時間短縮が見込める。
今回は再生時間4分50秒の4K MP4動画(ゲームプレー中の動画をGeForceのShareでキャプチャーしたもの)を1パスで変換する時間を計測する。フィルター処理は1270×720ドットへのリサイズ(Lanczos-3)、およびノイズ除去(範囲は“普通”)の2つを付与した。
エンコーダーにもGPUが使えるが、これは画質の悪いNVENCではなくx264を使用し、最終アウトプットとして720pのMP4が出力されるようにした。また、この処理をCPU(Core i7-8700K)のみで実施した場合の時間とも比較する。
CPUのみだと30分以上かかる作業も、CUDAの力を利用すれば8分台で終了できる。TITAN VはGTX 1080Tiより短時間で処理を終えられたが、GPUスペックや価格の差から期待されるほどのパフォーマンスアップには至らなかった。
こうした用途では当然ながら最適化というファクターが非常に重要なので、まだTMPGEnc側がVoltaアーキテクチャーを上手く扱えてないだけ、といえるだろう。
続いては「V-Ray Benchmark」を試す。CPU検証記事でもたびたび使用しているベンチマークだが、このベンチはCUDAのパフォーマンス計測にも利用できる。CPUとは処理の手法や使用するシーンが違うため、GPUのみで比較する。
このベンチは処理時間で結果がでるため、当然ながらグラフの短い方が速い。GTX 1080TiのOC版でも1分以上かかる処理が、TITAN Vにかかれば41秒と、大幅なパフォーマンスアップとなった。
こちらは特にTITAN Vへの対応をうたっているわけではないので、単純にアルゴリズムがTITAN Vと相性がよかったと考えられる。
ではどういった計算がTITAN Vで強いのか(演算ユニットの構成からほぼ自明だが……)を調べるために「Sandra 2017」の“GPGPU演算”テストを利用して調べてみた。
上のグラフの単位は“メガピクセル毎秒”であるため、長い方が性能が高いことになる。ここで注目なのは単精度浮動小数点(Single-Float Shaders)の処理はGTX 1080Tiからせいぜい18%しか向上していないのに対し、倍精度浮動小数点(Double-Float Shaders)では14倍以上に伸びている。TITAN VはFP64処理性能に軸足を置いたGPUであることが確認できた。
ソフトウェアがVoltaの計算力を使いこなすには、当然FP64を処理にできるだけ多く組み込む必要がある。だが残念ながらゲームでFP64はほぼ使われない。
FP32がゲームでは使い勝手がいいどころか、最近ではFP16の処理を高速化するGPU(つまりVega)すら出現している。VoltaをGeForceにするためには、TITAN Vを単純にスケールダウンしただけではダメなのだ。
もうひとつ、Sandraに収録されているGPGPU系ベンチマークのうち、GPGPUを利用した財務分析パフォーマンスの比較もしてみよう。このベンチではFP64ベースを利用して、さまざまな数値解析を行なう。この計算量を比較するというものだ。
このグラフでもバーが長い方が1秒あたりの計算量が多い。FP64モンスターであるところのTITAN Vが、GeForceに対して圧倒的なパフォーマンスを誇っているのがよくわかるだろう。
この連載の記事
-
第439回
自作PC
暴れ馬すぎる「Core i9-14900KS」、今すぐ使いたい人向けの設定を検証! -
第438回
デジタル
中国向け「Radeon RX 7900 GRE」が突如一般販売開始。その性能はWQHDゲーミングに新たな境地を拓く? -
第437回
自作PC
GeForce RTX 4080 SUPERは高負荷でこそ輝く?最新GeForce&Radeon15モデルとまとめて比較 -
第436回
デジタル
環境によってはGTX 1650に匹敵!?Ryzen 7 8700G&Ryzen 5 8600Gの実力は脅威 -
第435回
デジタル
VRAM 16GB実装でパワーアップできたか?Radeon RX 7600 XT 16GBの実力検証 -
第434回
自作PC
GeForce RTX 4070 Ti SUPERの実力を検証!RTX 4070 Tiと比べてどう変わる? -
第433回
自作PC
GeForce RTX 4070 SUPERの実力は?RTX 4070やRX 7800 XT等とゲームで比較 -
第432回
自作PC
第14世代にもKなしが登場!Core i9-14900からIntel 300まで5製品を一気に斬る -
第431回
デジタル
Zen 4の128スレッドはどこまで強い?Ryzen Threadripper 7000シリーズ検証詳報 -
第430回
デジタル
Zen 4世代で性能が爆上がり!Ryzen Threadripper 7000シリーズ検証速報 -
第429回
自作PC
Core i7-14700Kのゲーム性能は前世代i9相当に!Raptor Lake-S Refreshをゲーム10本で検証 - この連載の一覧へ