このページの本文へ

最新パーツ性能チェック 第222回

約37万円! Volta世代初のVGA「TITAN V」の怪物級性能を拝む

2018年01月11日 10時00分更新

文● 加藤 勝明 編集●北村/ASCII編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

倍精度モンスターが牙をむく

 ここまでゲームの性能を中心に見てきたが、GPGPU関係の性能もチェックしておきたい。本来なら機械学習のパフォーマンスで見るべきだが、まだコンシューマー用途で機械学習のパフォーマンスを活かせるキラーソフトがないため、一般的なGPGPUベンチでの比較にとどめる。

 まずは動画エンコーダー「TMPGEnc Video Mastering Works 6」でのパフォーマンスをチェックする。このソフトでは一部フィルター処理にCUDAを利用することができ、CPUだけで処理をするよりも大幅な処理時間短縮が見込める。

 今回は再生時間4分50秒の4K MP4動画(ゲームプレー中の動画をGeForceのShareでキャプチャーしたもの)を1パスで変換する時間を計測する。フィルター処理は1270×720ドットへのリサイズ(Lanczos-3)、およびノイズ除去(範囲は“普通”)の2つを付与した。

 エンコーダーにもGPUが使えるが、これは画質の悪いNVENCではなくx264を使用し、最終アウトプットとして720pのMP4が出力されるようにした。また、この処理をCPU(Core i7-8700K)のみで実施した場合の時間とも比較する。

「TMPGEnc Video Mastering Works 6」における動画変換時間

 CPUのみだと30分以上かかる作業も、CUDAの力を利用すれば8分台で終了できる。TITAN VはGTX 1080Tiより短時間で処理を終えられたが、GPUスペックや価格の差から期待されるほどのパフォーマンスアップには至らなかった。

 こうした用途では当然ながら最適化というファクターが非常に重要なので、まだTMPGEnc側がVoltaアーキテクチャーを上手く扱えてないだけ、といえるだろう。

 続いては「V-Ray Benchmark」を試す。CPU検証記事でもたびたび使用しているベンチマークだが、このベンチはCUDAのパフォーマンス計測にも利用できる。CPUとは処理の手法や使用するシーンが違うため、GPUのみで比較する。

「V-Ray Benchmark(CUDA)」の処理時間

 このベンチは処理時間で結果がでるため、当然ながらグラフの短い方が速い。GTX 1080TiのOC版でも1分以上かかる処理が、TITAN Vにかかれば41秒と、大幅なパフォーマンスアップとなった。

 こちらは特にTITAN Vへの対応をうたっているわけではないので、単純にアルゴリズムがTITAN Vと相性がよかったと考えられる。

 ではどういった計算がTITAN Vで強いのか(演算ユニットの構成からほぼ自明だが……)を調べるために「Sandra 2017」の“GPGPU演算”テストを利用して調べてみた。

「Sandra 2017」“GPGPU演算”のパフォーマンス

 上のグラフの単位は“メガピクセル毎秒”であるため、長い方が性能が高いことになる。ここで注目なのは単精度浮動小数点(Single-Float Shaders)の処理はGTX 1080Tiからせいぜい18%しか向上していないのに対し、倍精度浮動小数点(Double-Float Shaders)では14倍以上に伸びている。TITAN VはFP64処理性能に軸足を置いたGPUであることが確認できた。

 ソフトウェアがVoltaの計算力を使いこなすには、当然FP64を処理にできるだけ多く組み込む必要がある。だが残念ながらゲームでFP64はほぼ使われない。

 FP32がゲームでは使い勝手がいいどころか、最近ではFP16の処理を高速化するGPU(つまりVega)すら出現している。VoltaをGeForceにするためには、TITAN Vを単純にスケールダウンしただけではダメなのだ。

 もうひとつ、Sandraに収録されているGPGPU系ベンチマークのうち、GPGPUを利用した財務分析パフォーマンスの比較もしてみよう。このベンチではFP64ベースを利用して、さまざまな数値解析を行なう。この計算量を比較するというものだ。

「Sandra 2017」“GPGPU財務分析”のパフォーマンス

 このグラフでもバーが長い方が1秒あたりの計算量が多い。FP64モンスターであるところのTITAN Vが、GeForceに対して圧倒的なパフォーマンスを誇っているのがよくわかるだろう。

仮想通貨にも効くだろうということで“Claymore Dual GPU Miner”でEthereumマイニングをさせてみた。デフォルト設定のTITAN V1枚でのハッシュレートは68MH/秒台(GTX 1080Tiはメモリーがネックになり32MH/秒あたり)。今回の検証環境におけるマイニング時の消費電力は200W以下だった

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

ピックアップ

ASCII.jpメール アキバマガジン

ASCII.jp RSS2.0 配信中