得意の28nmを再設計し改良
20nmが白紙に戻ったことで、今後どうするかであるが、16nm FinFETまで新製品の投入を遅らせるのはあまりに遅すぎる。それもあって、急遽28nmにプロセスを戻した上で、改めてGM204の再設計が始まった。要するにGM107の規模拡大版である。
さすがにこの新しいGM204の設計と製造にはほとんど問題がなかった。もうすでにNVIDIAはTSMCの28nmに十分習熟しているし、28nmプロセスそのものの歩留まりも十分高い。さすがにシェーダーの規模は、オリジナルのGM204が20 SMMだったものを、14 SMMまで減らすことになっている。
さもないとGK110と変わらない規模になってしまい、価格的につらいためである。とはいえ、ダイサイズそのものはGK104-A2より確実に大きくなってしまったようだ。ただ幸いなことに、昨今は28nmプロセスの製造コストが以前に比べると下がっている。これに関しては連載261回で説明したが、この結果としてGM204のダイの原価は、GK104の当初の原価と同程度かやや低い程度に抑えられると見られる。
さて、そのGM204は6月前には最初のエンジニアリングサンプルが出てきており、評価ではおおむね想定通りの性能が出ているらしいのだが、想定外だったのは高負荷時のMaxwellの性能がKeplerに及ばないということだった。
もともとKeplerはCUDAコア数と命令発行ユニット、それとメモリーアクセス性能が大体1:1:1くらいのバランスを狙ったもので、Maxwellではこれを4:4:3位の比率にしている。つまりCUDAコアがやや過剰に処理する仕組みだが、Keplerはバランスこそ取れているものの、ボトルネックになるのは最終的にメモリー帯域であり、これをフルに使うにはやや冗長度が高かった。
そこでMaxwellでは命令発行と処理の比率を引き上げて、メモリー帯域をフルに使おうという発想である。ところがGM107くらいの規模だとこれがうまくいったのだが、新設計のGM204で同じことをやると、逆にメモリー帯域、正確にはメモリーアクセスのための内部のインターコネクトがボトルネックになりやすいらしく、ピーク性能ではKeplerに及ばないというシーンもいくつかあるらしい。
こうしたことを勘案し、GM204世代では「GeForce GTX 780」と「GeForce GTX 770」を、GM204コアの「GeForce GTX 980」および「GeForce GTX 970」で置き換えるものの、「GeForce GTX 780 Ti」以上のグレードに関しては引き続きGK110コアベースのまま継続販売という判断が下された模様だ。当初はGM204ベースの「GeForce GTX 980 Ti」も噂されていたものの、これはどうもなくなってしまったようだ。
そんなわけでロードマップに戻ると今月中にこの「GeForce GTX 980」と「GeForce GTX 970」がリリースされる予定だ。800番台がスキップされてしまったのは、すでにモバイル向けにはGeForce 820M~GeForce GTX 880Mという800番台の製品がGF117/GK104/GM107/GM108と幅広いアーキテクチャーのまま出荷されており、これとGM200世代が混じるとわかりづらいからということで、改めてGM200世代のコアはデスクトップ/モバイルとも900番台にそろえるという判断があったそうである。
このGM204に続き、第4四半期(11月と聞いているが、若干早まるかもしれない)には「GeForce GTX 960」も投入される。今ハッキリしないのがこのGeForce GTX 960の素性で、GM204コアをそのまま使うという話と、新たにGM206コアが投入されるという話の両方がある。
ひょっとするとGeForce GTX 960はGM206コアで、後追いで「GeForce GTX 960 Ti」がGM204コアで投入される可能性もあるだろうが、現状そこまでははっきりしない。
→次のページヘ続く (20nmを飛ばして次は16nmに)
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ