歩留まりの悪い「Tsela K20」を
「GeForce GTX 780」として再利用?
「GeForce GTX 780」の特徴や性能はこちらにレビューがあるので、今回は繰り返さないが、面白いのは13 SMXではなく12 SMXとしたことだ。実際、NVIDIAが公開したGeForce GTX 780のスペックシートをみると、“Graphics Processing Cluster”が4ないし5とされている。
下の画像はGK110コアの構造であるが、たとえばダイの欠陥が複数のクラスターに分散していれば、合計でSMXを3つ無効にしたとしてもクラスターの数そのものは5つになる。ところが、ある特定のクラスターに欠陥が集中していると、そのクラスターをまるごと無効化することになり、クラスターの数は4になるわけだ。
これがTesla K20の場合、SMXは13なので、無効化できるSMXは2つまでとなり、どうやってもクラスターは5つになる。要するに、Tsela K20と同じ13 SMX構成では、歩留まりを上げるのにまだ十分ではなかった、ということなのだろう。このため、SMXをさらに減らすことでTesla K20としても使えなかったダイまで救った、というあたりが本当のところではなかろうか。
500mm2を超えるダイであれば、この程度の冗長性で救えるなら安いものであろう。GeForce GTX 780の価格は(初値は9万超えもあったようだが)おおむね8万5000円前後で落ち着きそうだ(関連記事)。
NVIDIAとしてはこれまで欠陥が多すぎて使えなかったダイを再利用でき、ユーザーとしてはそれほどGeForce GTX Titanと大きな性能差のないカードを、ずっと安価に購入できるということで、お互いにメリットのある製品だとも言える。
ただ、こうなるとその下のグレードの製品をGK110で出せるか、と言われるとこれも難しいところ。ものすごくラフな言い方をすると、SMXを2つ減らすと価格が3万円下がるわけで、仮にSMXをさらに2つ減らして8基の構成にすると、5万円くらいで売らないといけなくなる。
「GeForce GTX 770」は
GK104の改良版
SMXが8つというのはGK104コアと同じであり、こうなるとダイサイズの差、つまりダイの原価がモロに響いてくるため、GK110ベースで作ることにあまり意味はない。もっとも本当に歩留まりが悪くて欠陥コアが多い、という状況ではそれを救うために無理やりにでもこうした構成の製品を出す可能性はあるが、今回はそこまでひどくはなかったようだ。結果、5月30日にリリースされた「GeForce GTX 770」は、GK110ベースではなくGK104ベースとなった。
もっともこれは完全にGK104そのままかというと、そういうわけでもない。というのはGPU BoostがGeForce GTX 780/Titan相当のGPU Boost 2.0になっているからだ。またコアの動作周波数は1006/1058MHzから1046/1085MHzに若干引き上げられているが、これに加えてメモリークロックも6008MHzから7010MHzに引き上げられている。
ダイへの影響、という意味ではこのメモリークロックの方が確実に大きく、メモリーコントローラー周りがより高速動作できるように手が入ったことは確実である。「GeForce GTX 680」に対する性能改善は、もっぱらこのメモリーコントローラーの改良にともなうメモリー帯域の増大によるところが大きい。
こうした変更の結果として、TDPも195Wから230Wに上がっているので、省電力性という観点ではそれほど大きな改善はなさそうである。
コアそのものは、当初言われていたGK114ではなく、GK104のA2という新リビジョンとして出てくることになった。かつてはKepler 2.0、あるいはKepler Refreshという名前で知られていた。
2013年におけるプラットフォームとしてコアの名前はGK110/GK114/GK116といわれていたのだが、GK110はともかくGK114/GK116はそれぞれGK104-A2/GK106-A2ということで落ち着いたのかもしれない。
ちなみにこれ以外のアップデートとしては、3月に投入された「GeForce GTX 650 Ti Boost」がある。こちらは「Radeon HD 7790」の対抗馬とでもいう製品で、構成的には「GeForce GTX 660」のシェーダー数を減らしただけの製品である。性能レンジとしてはちょうど「GeForce GTX 660」と「GeForce GTX 650 Ti」の中間あたりに位置することになり、価格もこれに合わせたものとなっている。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ