得意の28nmを再設計し改良
20nmが白紙に戻ったことで、今後どうするかであるが、16nm FinFETまで新製品の投入を遅らせるのはあまりに遅すぎる。それもあって、急遽28nmにプロセスを戻した上で、改めてGM204の再設計が始まった。要するにGM107の規模拡大版である。
さすがにこの新しいGM204の設計と製造にはほとんど問題がなかった。もうすでにNVIDIAはTSMCの28nmに十分習熟しているし、28nmプロセスそのものの歩留まりも十分高い。さすがにシェーダーの規模は、オリジナルのGM204が20 SMMだったものを、14 SMMまで減らすことになっている。
さもないとGK110と変わらない規模になってしまい、価格的につらいためである。とはいえ、ダイサイズそのものはGK104-A2より確実に大きくなってしまったようだ。ただ幸いなことに、昨今は28nmプロセスの製造コストが以前に比べると下がっている。これに関しては連載261回で説明したが、この結果としてGM204のダイの原価は、GK104の当初の原価と同程度かやや低い程度に抑えられると見られる。
さて、そのGM204は6月前には最初のエンジニアリングサンプルが出てきており、評価ではおおむね想定通りの性能が出ているらしいのだが、想定外だったのは高負荷時のMaxwellの性能がKeplerに及ばないということだった。
もともとKeplerはCUDAコア数と命令発行ユニット、それとメモリーアクセス性能が大体1:1:1くらいのバランスを狙ったもので、Maxwellではこれを4:4:3位の比率にしている。つまりCUDAコアがやや過剰に処理する仕組みだが、Keplerはバランスこそ取れているものの、ボトルネックになるのは最終的にメモリー帯域であり、これをフルに使うにはやや冗長度が高かった。
そこでMaxwellでは命令発行と処理の比率を引き上げて、メモリー帯域をフルに使おうという発想である。ところがGM107くらいの規模だとこれがうまくいったのだが、新設計のGM204で同じことをやると、逆にメモリー帯域、正確にはメモリーアクセスのための内部のインターコネクトがボトルネックになりやすいらしく、ピーク性能ではKeplerに及ばないというシーンもいくつかあるらしい。
こうしたことを勘案し、GM204世代では「GeForce GTX 780」と「GeForce GTX 770」を、GM204コアの「GeForce GTX 980」および「GeForce GTX 970」で置き換えるものの、「GeForce GTX 780 Ti」以上のグレードに関しては引き続きGK110コアベースのまま継続販売という判断が下された模様だ。当初はGM204ベースの「GeForce GTX 980 Ti」も噂されていたものの、これはどうもなくなってしまったようだ。
そんなわけでロードマップに戻ると今月中にこの「GeForce GTX 980」と「GeForce GTX 970」がリリースされる予定だ。800番台がスキップされてしまったのは、すでにモバイル向けにはGeForce 820M~GeForce GTX 880Mという800番台の製品がGF117/GK104/GM107/GM108と幅広いアーキテクチャーのまま出荷されており、これとGM200世代が混じるとわかりづらいからということで、改めてGM200世代のコアはデスクトップ/モバイルとも900番台にそろえるという判断があったそうである。
このGM204に続き、第4四半期(11月と聞いているが、若干早まるかもしれない)には「GeForce GTX 960」も投入される。今ハッキリしないのがこのGeForce GTX 960の素性で、GM204コアをそのまま使うという話と、新たにGM206コアが投入されるという話の両方がある。
ひょっとするとGeForce GTX 960はGM206コアで、後追いで「GeForce GTX 960 Ti」がGM204コアで投入される可能性もあるだろうが、現状そこまでははっきりしない。
→次のページヘ続く (20nmを飛ばして次は16nmに)
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ