GPGPUとして使うには
設定が必要
最後にDynamic ParallelismとHyper-Qを説明しよう。これはK20X/K20にも搭載されている機能である。Dynamic Parallelismは、複数のプログラムをGPU上に登録しておき、あるGPUのプログラムから別のGPUのプログラムを呼び出せるようにするものである。
Hyper-Qは、プログラムを登録するキューを32個用意しておき、CUDAコアを適当なグループに分割してそれぞれ別のプログラムを割り当てるという仕組みだ。詳細はNVIDIAのウェブサイト(関連リンク)に詳細が載っている。
微妙なのはDouble Precisionのサポート。記事の冒頭で「1つのSMXには192のCUDAコアが含まれる」と説明したが、このSMXの内部を示したのが下の画像である。確かにCUDAコア、つまりSingle Precisionの演算器は192個あり、これ以外にDouble Precisionの演算器が64個、Load/Store Unit(濃い緑色)が32個、SFU※が32個含まれている。
※ Special Function Unit。三角関数などの特殊な演算用ユニットのこと。
Double Precisionの演算器を潰しているわけではないのだが、TITANの主用途であるグラフィックの利用時にはDouble Precisionはまったくの用無しである。そこでデフォルトではこのDouble Precisionは無効にされている。これを有効にするためには、NVIDIA Control Panelの“CUDA-Double precision”という項目で「GeForce GTX TITAN」に有効のチェックを入れる必要がある。GPGPU的な使い方をしなければこれで十分、ということだろう。
お詫びと訂正:掲載当初、TITANではDynamic ParallelismとHyper-Qは無効にされていると記載しましたが、正しくは有効な機能です。ここに訂正するとともに、お詫びいたします。(2013年2月26日)
超高価なビデオカードを
寿命を縮める覚悟でぶん回す
すでにレビューも出ている通り、GeForce GTX TITANはシングルGPUカードとしては最高速性能であり、これを上回るのはGeForce GTX 690か、まもなく登場するといわれるデュアルRadeon HD 7970(あくまでRadeon HD 7990ではない)などのデュアルGPU搭載カードだけである。
ただしその分価格も999ドル。日本における市販価格は10~13万と言われている。この高額なカードを、寿命が短くなることを覚悟でOver voltage動作でぶん回すというのは、それはそれで贅沢な使い方という気もするが、色々な意味であまり一般ユーザーには縁のない製品かもしれない。
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ