SANDRA 2013では
TITANの完全勝利ならず
ハイエンドGPUには、画像処理以外にも汎用の数値演算に使う「GPGPU」という利用法もある。Teslaの血を受け継いでいるTITANのこと、さぞGPGPUも凄かろう。Keplerはゲーム性能とワットパフォーマンスを重視するあまり、倍精度浮動小数点演算機能をかなり省いた存在だ。だがTITANにはGTX680にはない“倍精度浮動小数点演算専用のプロセッサー”、すなわちDP(Double Precision)が搭載されている。
このDPの動作クロックは消費電力を抑えるためにコアクロックの8分の1に抑えられているが、NVIDIAコントロールパネル内の設定を変更することで、DPを本来のコアと等速にできる。アプリごとのプロファイルに設定しておけば、ゲーム時はDPは8分の1、GPGPUを使うアプリの時はフルスピードという使い分けも可能なのだ。
ただこのモードでは、発熱量が上がるため全体の動作クロックが低下するという副作用がある。ではどの程度性能が落ちるのか「3DMark」のFire Strikeで検証してみた。「GTX TITAN@DP」とは、DPをフルスピードで動作させる設定を示している。
ここでは総合スコアの他に、GraphicsとPhysicsの部門スコアも比較する。Graphicsスコアへの影響が大きいことから、GPUのクロック低下の影響をモロに受けていることがわかる。一方CPUをメインに使うPhysicsは、ほとんど影響を受けていない。クロックの変動を調べてみたところ、(今回のテスト環境では)デフォルトで992MHzまでブーストされたのに対し、DPを有効にすると849MHzで頭打ちとなった。
実際のアプリでどこまで速くなるかの検証は割愛するが、CUDAを使ってゴリゴリ計算したいが、倍精度が遅いGeForce 600シリーズはちょっと……と考えていた人には、TITANは非常におもしろいGPUではなかろうか。
そこで「SANDRA」の「GP演算」および「GP暗号処理」の2つのベンチを使ってDirectComputeによるGPGPU演算性能をチェックしてみた。
まずは単純な計算力を見るGP演算。ダブル(倍精度)シェーダーがDPをフルスピードにした途端、3倍以上にハネ上がっているのに注目。ただしこのテストではHD7970の結果が圧倒的だ。
興味深いことに、DPフルスピード化は必ずしも効果があるわけではないようだ。AES256の暗号/復号処理とSHA256によるハッシュ処理は整数演算の弱いKepler系には鬼門。ゆえにここでもHD7970が圧倒的だが、DPをフルスピードにするとかえってスループットが下がっている点に注目したい。
ちなみに、(グラフには入れられなかったが)CUDAで同じテストをすると、DPのフル/8分の1スピード関係なしに3項目とも14GB台まで安定して上がる。とはいえ、CUDAを使ったとしても整数演算が弱いというKepler系列の弱さを克服することはできない、ということだ。
この連載の記事
-
第439回
自作PC
暴れ馬すぎる「Core i9-14900KS」、今すぐ使いたい人向けの設定を検証! -
第438回
デジタル
中国向け「Radeon RX 7900 GRE」が突如一般販売開始。その性能はWQHDゲーミングに新たな境地を拓く? -
第437回
自作PC
GeForce RTX 4080 SUPERは高負荷でこそ輝く?最新GeForce&Radeon15モデルとまとめて比較 -
第436回
デジタル
環境によってはGTX 1650に匹敵!?Ryzen 7 8700G&Ryzen 5 8600Gの実力は脅威 -
第435回
デジタル
VRAM 16GB実装でパワーアップできたか?Radeon RX 7600 XT 16GBの実力検証 -
第434回
自作PC
GeForce RTX 4070 Ti SUPERの実力を検証!RTX 4070 Tiと比べてどう変わる? -
第433回
自作PC
GeForce RTX 4070 SUPERの実力は?RTX 4070やRX 7800 XT等とゲームで比較 -
第432回
自作PC
第14世代にもKなしが登場!Core i9-14900からIntel 300まで5製品を一気に斬る -
第431回
デジタル
Zen 4の128スレッドはどこまで強い?Ryzen Threadripper 7000シリーズ検証詳報 -
第430回
デジタル
Zen 4世代で性能が爆上がり!Ryzen Threadripper 7000シリーズ検証速報 -
第429回
自作PC
Core i7-14700Kのゲーム性能は前世代i9相当に!Raptor Lake-S Refreshをゲーム10本で検証 - この連載の一覧へ