Tesla K20Xの血を受け継ぐGeForce GTX TITANの損得勘定

2013年02月25日 12時00分更新

　チップセット黒歴史編を始めたばかりであるが、NVIDIAからGeForce GTX TITANがリリースされたので、今回は黒歴史をお休みして、GeForce GTX TITANの解説をしよう。

GeForce GTX TITANの基板写真

　前回のロードマップで、「筆者は、GK110を投入しない方に一票を投じたい」と書いたのだが、見事に外れてしまった。GeForce GTX TITANはGK110コアをそのまま搭載した製品で、トランジスター数は71億個にもおよぶものであった。

スペックはGK110ベースの「Tesla K20X」と同等だ

　NVIDIA提供の基板写真を見ると、GK110のダイの寸法は23.5mm×24.5mmで575.75mm²になる計算だ。もっともこれは多少誤差を含んだ数字なので、おそらく540～550mm²くらいになるはずだが、それでもかなり大きなサイズである。

PCI Express x16のカードエッジの長さが85mmなので、そこからの比でダイサイズを推定した。そのため多少の誤差はあるだろう

　300mmウェハー1枚で、どんなに効率良く取っても100個取れるかどうかという規模である。28nmプロセスの場合、ウェハー１枚の生産コストが100万円の大台に達しているらしいので、歩留まりが100％としてもダイの原価が1個1万円という計算になる。実際はこんなに歩留まりが良いことはありえないので、原価が2万とは言わないものの、1.5万円くらいには達していそうだ。

消費電力を重視するTeslaと
絶対性能を重視するTITAN

　GeForce GTX TITANのダイそのものは、NVIDIAのGPGPU向け製品であるTesla K20/K20Xと同じであるが、スペックや機能には、以下のような違いがある。

コア数/動作周波数

メモリ構成、メモリ動作周波数

映像出力端子/Display Overclocking

TDPとGPU Boost 2.0

Dynamic Parallelism/Hyper-Q

Double Precisionのサポート

　この違いについてもう少し細かく説明したい。

　まずコア数であるが、元々GK110コアは15のSMX(Streaming Multiprocessor eXtreme)と、2880のCUDAコアを搭載している。ただし、これを全て有効にする使い方だと、歩留まりが下がってしまう。そこでK20Xでは14SMX、K20では13SMXのみを有効にしている。あるSMXに欠陥があっても、そこを無効化すれば解決するため、歩留まりを下げずに済む。

　そこでTITANは、K20Xと同様に14SMXでの構成となった。これは、GK110の歩留まりが予想以上に良いので、SMXを1つ無効化すれば良いというよりも、そもそもTITANの出荷量がそれほど多くないため、14SMX構成でもまかなえると判断したのだろう。1つのSMXにはGeForce GTX 680同様、192のCUDAコアが含まれるので、それぞれCUDAコア数は2496、2688になる計算で、TITANも2688になる。

なぜかインテルの「Core i7-3960X」を引き合いに出してスペックを比較するNVIDIAの資料。GeForce GTX 680(1536コア、35億トランジスター)との比較でもよかったように思える

　CUDAコア数は減ったものの、コアの動作周波数はやや引き上げられている。K20Xが732MHz、K20が706MHz駆動なのに対し、TITANでは837MHz(Base Clock)になっている。Tesla系は一度計算を始めると長時間、それこそ1日以上フル稼働させる使い方をするので、発熱などを考えると動作周波数を上げにくいという事情がある。一方のTITANはグラフィック向けなので、長時間稼動させることは考えなくても良い。

　またTeslaはデータセンターなどで、多数のカードが同時に稼動することを前提としているので、１枚あたりの絶対性能よりも性能/消費電力比を高めるほうが重視されており、このためには多少駆動電圧を下げ、動作周波数を落としたほうが有利である。TITANはピーク性能重視なので、むしろ電圧を上げて性能を高めたほうが好ましい。動作周波数が100MHz以上も違うのは、そのあたりが関係している。

ECCメモリーは非サポート

　次はメモリー構成。K20Xは384bit幅で5.2GHz駆動、K20は320bit幅でやはり5.2GHz駆動なのに対し、TITANは384bit幅で6GHz駆動となっている。もちろんGPUコアの動作周波数にある程度マッチする帯域を確保しないと意味がないので、動作周波数そのものが違うのは当然だが、それよりも大きな違いは、K20X/K20ではECCメモリーをサポートしているが、TITANは非サポートな点だ。

　ECC(Error Check and Correct)は、エラーの検出と訂正を行なう仕組みである。メモリーの場合は通常9bit幅(データ8bit＋ECC用が1bit)の構成で、2bitのエラー検出と1bitのエラー訂正が可能である。サーバー向けのDIMMでもやはりECC付きのものがあるが原理は同じだ。

　科学技術計算などで長時間連続稼動を想定する場合、ECCの対応は必須であり、Teslaではメモリーのみならず内部のバスもECCで保護しているが、TITANではこうした装備は不要ということで、ばっさり削られている。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

Tesla K20Xの血を受け継ぐGeForce GTX TITANの損得勘定

消費電力を重視するTeslaと 絶対性能を重視するTITAN

ECCメモリーは非サポート

この連載の記事

この記事の編集者は以下の記事をオススメしています

PC ロードマップでわかる！当世プロセッサー事情（目次）

自作PC GeForce GTX TITANはWQHD解像度で60fpsをキープ可能？

ビデオカード NVIDIA、シングルGPU最速のGeForce GTX TITANを発表

PC 2013年のGeForceはKepler 2.0の「GK114」を3月投入？

自作PC 「GeForce GTX 780」は新シリーズらしい力を示せるか？

PC 「GeForce GTX 700」シリーズを揺さぶる7GbpsのGDDR5

PC NVIDIAは20nmプロセスの前倒しで新コアMaxwellの投入を早める

PC Radeon R9/R7に刷新するAMDの2013年GPUロードマップ

PC GTX 780 Tiの次は？ ロードマップでMaxwellの投入時期を予想

PC SoC技術論 プロセッサーのワンチップ化が進む理由と仕組み

PC Maxwellで読めてきた、20nmへ移行するNVIDIAロードマップ

PC Pirate Islandsは今秋登場か？ AMDのGPUロードマップ

自作PC 4Kの描画負荷に対抗できる“野獣”「GeForce GTX TITAN X」

注目ニュース

ピックアップ

アスキーストア's 人気ランキング ベスト5

消費電力を重視するTeslaと
絶対性能を重視するTITAN

PC
ロードマップでわかる！当世プロセッサー事情（目次）

自作PC
GeForce GTX TITANはWQHD解像度で60fpsをキープ可能？

ビデオカード
NVIDIA、シングルGPU最速のGeForce GTX TITANを発表

PC
2013年のGeForceはKepler 2.0の「GK114」を3月投入？

自作PC
「GeForce GTX 780」は新シリーズらしい力を示せるか？

PC
「GeForce GTX 700」シリーズを揺さぶる7GbpsのGDDR5

PC
NVIDIAは20nmプロセスの前倒しで新コアMaxwellの投入を早める

PC
Radeon R9/R7に刷新するAMDの2013年GPUロードマップ

PC
GTX 780 Tiの次は？　ロードマップでMaxwellの投入時期を予想　

PC
SoC技術論　プロセッサーのワンチップ化が進む理由と仕組み

PC
Maxwellで読めてきた、20nmへ移行するNVIDIAロードマップ

PC
Pirate Islandsは今秋登場か？　AMDのGPUロードマップ

自作PC
4Kの描画負荷に対抗できる“野獣”「GeForce GTX TITAN X」

アスキーストア's 人気ランキングベスト5