得意の28nmを再設計し改良
20nmが白紙に戻ったことで、今後どうするかであるが、16nm FinFETまで新製品の投入を遅らせるのはあまりに遅すぎる。それもあって、急遽28nmにプロセスを戻した上で、改めてGM204の再設計が始まった。要するにGM107の規模拡大版である。
さすがにこの新しいGM204の設計と製造にはほとんど問題がなかった。もうすでにNVIDIAはTSMCの28nmに十分習熟しているし、28nmプロセスそのものの歩留まりも十分高い。さすがにシェーダーの規模は、オリジナルのGM204が20 SMMだったものを、14 SMMまで減らすことになっている。
さもないとGK110と変わらない規模になってしまい、価格的につらいためである。とはいえ、ダイサイズそのものはGK104-A2より確実に大きくなってしまったようだ。ただ幸いなことに、昨今は28nmプロセスの製造コストが以前に比べると下がっている。これに関しては連載261回で説明したが、この結果としてGM204のダイの原価は、GK104の当初の原価と同程度かやや低い程度に抑えられると見られる。
さて、そのGM204は6月前には最初のエンジニアリングサンプルが出てきており、評価ではおおむね想定通りの性能が出ているらしいのだが、想定外だったのは高負荷時のMaxwellの性能がKeplerに及ばないということだった。
もともとKeplerはCUDAコア数と命令発行ユニット、それとメモリーアクセス性能が大体1:1:1くらいのバランスを狙ったもので、Maxwellではこれを4:4:3位の比率にしている。つまりCUDAコアがやや過剰に処理する仕組みだが、Keplerはバランスこそ取れているものの、ボトルネックになるのは最終的にメモリー帯域であり、これをフルに使うにはやや冗長度が高かった。
そこでMaxwellでは命令発行と処理の比率を引き上げて、メモリー帯域をフルに使おうという発想である。ところがGM107くらいの規模だとこれがうまくいったのだが、新設計のGM204で同じことをやると、逆にメモリー帯域、正確にはメモリーアクセスのための内部のインターコネクトがボトルネックになりやすいらしく、ピーク性能ではKeplerに及ばないというシーンもいくつかあるらしい。
こうしたことを勘案し、GM204世代では「GeForce GTX 780」と「GeForce GTX 770」を、GM204コアの「GeForce GTX 980」および「GeForce GTX 970」で置き換えるものの、「GeForce GTX 780 Ti」以上のグレードに関しては引き続きGK110コアベースのまま継続販売という判断が下された模様だ。当初はGM204ベースの「GeForce GTX 980 Ti」も噂されていたものの、これはどうもなくなってしまったようだ。
そんなわけでロードマップに戻ると今月中にこの「GeForce GTX 980」と「GeForce GTX 970」がリリースされる予定だ。800番台がスキップされてしまったのは、すでにモバイル向けにはGeForce 820M~GeForce GTX 880Mという800番台の製品がGF117/GK104/GM107/GM108と幅広いアーキテクチャーのまま出荷されており、これとGM200世代が混じるとわかりづらいからということで、改めてGM200世代のコアはデスクトップ/モバイルとも900番台にそろえるという判断があったそうである。
このGM204に続き、第4四半期(11月と聞いているが、若干早まるかもしれない)には「GeForce GTX 960」も投入される。今ハッキリしないのがこのGeForce GTX 960の素性で、GM204コアをそのまま使うという話と、新たにGM206コアが投入されるという話の両方がある。
ひょっとするとGeForce GTX 960はGM206コアで、後追いで「GeForce GTX 960 Ti」がGM204コアで投入される可能性もあるだろうが、現状そこまでははっきりしない。
→次のページヘ続く (20nmを飛ばして次は16nmに)
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 -
第864回
PC
なぜAMDはチップレットで勝利したのか? 2万ドルのウェハーから逆算する経済的合理性 -
第863回
PC
銅配線はなぜ限界なのか? ルテニウムへの移行で変わる半導体製造の常識と課題 -
第862回
PC
「ビル100階建て相当」の超難工事! DRAM微細化が限界を超え前人未到の垂直化へ突入 -
第861回
PC
INT4量子化+高度な電圧管理で消費電力60%削減かつ90%性能アップ! Snapdragon X2 Eliteの最先端技術を解説 -
第860回
PC
NVIDIAのVeraとRubinはPCIe Gen6対応、176スレッドの新アーキテクチャー搭載! 最高クラスの性能でAI開発を革新 -
第859回
デジタル
組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現 -
第858回
デジタル
CES 2026で実機を披露! AMDが発表した最先端AIラックHeliosの最新仕様を独自解説 - この連載の一覧へ











