だんだんプロセスの話が最近の話題に近づいてきたところで恐縮であるが、CESなどで製品ロードマップのアップデートが相次いだので、プロセスの話はお休みして、主要メーカーの製品ロードマップをお届けしよう。
GeForce GTX 780 Ti
1番手はNVIDIAのGPUである。前回は昨年10月だったので、まずはそこからの差分を解説しよう。
前回からの大きな違いとしては、GK110コアの製品が大幅に拡充されたことだ。それまでは「GeForce GTX Titan」と「GeForce GTX 780」の2製品で、これで打ち止めかと思ったのだが、予想に反して2013年11月に「GeForce GTX 780 Ti」を投入した(関連記事)。
本来GeForce GTX Titanなどに使われるGK110コアは5GPC(Graphics Processing Cluster)構成で、各々のGPCが5つのSMXというユニットを内蔵する。1つのSMXは192基のシェーダーで構成されるので、フル構成だと192×5×3=2880基のシェーダーが搭載される計算になるが、GeForce GTX Titanではこのうち1つ、GeForce GTX 780では3つのSMXを無効化してリリースしていた。
これは性能の差別化という観点もあるが、533mm2もの巨大なダイとなると、歩留まりは猛烈に悪くなりがちである。これを回避するためには、欠陥が多少あっても、それを含むSMXユニットを無効化してしまえばいいわけで、実際GeForce GTX Titanが14 SMX構成なのはそうした理由と思われる。
しかし、GeForce GTX Titanの出荷開始から半年ほど経過し、ある程度歩留まりが改善してきた、もしくは歩留まりの見極めがついたのだろう。GeForce GTX 780 TiではすべてのSMXを有効にしたフル構成としてリリースされた。
おまけに動作周波数もやや引き上げられ、メモリーも7Gbpsまで高速化されており、明らかに上位製品であるGeForce GTX Titanを上回る性能を発揮した。さすがにそうなるとGeForce GTX Titanの立場がなくなることもあり、GK110では本来搭載されていた倍精度浮動小数点演算のサポートを切る形で差別化を図っている。とはいえ数値演算とかはともかく、ゲームに関しては間違いなくGeForce GTX 780 Tiの方が高速である。
これに続き、今年2月18日には、GeForce GTX Titanの上位製品として「GeForce GTX Titan Black」も発表した(関連記事)。シェーダー構成は15 SMXとフルに有効にされ、動作周波数はGeForce GTX 780 Tiより微妙に引き上げられた上、メモリーは従来の倍の6GBになり、加えて倍精度浮動小数点演算が有効にされた。要するに「全部アリ」のハイエンド版である。
用途としては、もうゲーム用というよりは限りなくGPGPU向けである。頑張ればもうすこし動作周波数を上げられるかもしれないが、消費電力や発熱の観点からすると大幅に引き上げるのは難しく、今度こそGK110はここで打ち止めということになりそうだ。
このGeForce GTX Titan Blackと同時に発表されたのが、Maxwellコアの「GeForce GTX 750 Ti」と「GeForce GTX 750」である。コード名がGM106ということからわかる通り、これはメインストリームの中間から下、といった位置付けになる。これはNVIDIAの資料からも明らかだ。
Maxwellコアは、基本的なシェーダー(CUDAコア)の内部構造がまだ明らかになっていないが、これまでのSMXの内部を4つに分解したようなSMMと呼ばれる構造で構成される。
各々のSMMは128基のシェーダーを搭載している。この結果、これまでは192シェーダーごとに1つのコントロールロジックだったのが、今度は32シェーダーごとに1つのコントロールロジックとなるわけで、コマンドの粒度(どれだけ細かく並列処理を行なえるかの度合い)が6倍になったことになる。
ただこの粒度の改善だけでは35%の性能改善や2倍の性能/消費電力比は実現出来ないわけで、このあたりはシェーダーそのものにも手が入っていると思われる。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第875回
PC
1000A超のAIプロセッサーをどう動かすか? Googleが実践する垂直給電(VPD)の最前線 -
第874回
PC
AIの未来は「電力」で決まる? 巨大GPUを支える裏面給電とパッケージ革命 -
第873回
PC
「銅配線はまだ重要か? 答えはYesだ」 NVIDIA CEOジェンスンが語った2028年ロードマップとNVLink 8の衝撃 -
第872回
PC
NVIDIAのRubin UltraとKyber Rackの深層 プロトタイプから露見した設計刷新とNVLinkの物理的限界 -
第871回
PC
GTC 2026激震! 突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰 -
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 -
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 - この連載の一覧へ











