今回はNVIDIAのGPUのロードマップアップデートをお届けしよう。前回のアップデートは、「GeForce GTX Titan Black」が発表された直後の2014年3月であったが、あれから色々同社の製品ラインナップには変化があった。最大のものは、20nmプロセスを使ったMaxwell 2.0コアがまるごと全部「なかったこと」になってしまったことだ。
新製品の出荷は
GeForce GT 720のみ
まずは出荷された製品についてのアップデートから。OEMベンダーごとのオーバークロック版や省電力版を除くと、新規の製品は5月にリリースされた「GeForce GT 720」(関連記事)のみである。
GeForce GT 720はKeplerコアを使いながら、シェーダーを半減した製品で、性能が低い分消費電力も価格も低い。もっともこのくらいになると、AMDのKaveriはもとよりインテルのCore iシリーズに内蔵されるGPUよりも性能が低かったりするので、使いどころに悩むところである。
20nmプロセスに移行するはずが
性能が出ず計画は白紙に
では、本題のMaxwell 2.0世代の話である。まずは以前のおさらいから。Maxwellは28nmプロセスで製造したGM107がリリースされ、次いで20nmプロセスに移行させたGM204がメインストリームの上の方に位置し、さらにGM204のサブセットとしてGM206コア、ローエンドのGM208コアがそれぞれ用意され、最後にトップエンド向けのGM200がリリースされる予定になっていた。
この順番、特にGM206/208とGM200の順序には諸説あり、GM200が先に出るという話もあったが、いずれにせよ基本的なコアはMaxwellで共通なので、あとはSMM(Streaming Multiprocessor Maxwell)をいくつコアに入れ、メモリーインターフェースをどうするか程度の違いしかない。なので論理設計の時間はそうかからず、もっぱら物理設計が主な作業となる。
すると、SMM数が膨大になると予想されていたGM200に比べて、かなりSMM数が少なくなるGM206/208の開発を平行して行なったとしても、GM206/208の方が先にテープアウトできるのは間違いない。
以上のことから、順序としてはGM107→GM204→GM206→GM208→GM200になるだろうという予想は妥当であったと思う。このうちGM107はMaxwellアーキテクチャーそのものの検証、GM204はTSMCの20nmプロセスの検証をそれぞれ兼ねており、これが問題なければすっかり20nmに移行できるはずだった。
これがどこでつまずいたかというと、20nmで製造した初代GM204であった。正確な時期は明確にされていないが、TSMCは20nmに関して2013年中に複数の製品がテープアウトしたと発表しており、この中にGM204も含まれていたのは間違いない。
これに基づき製造された最初のエンジニアリングサンプルは、2014年3月頃にTSMCからNVIDIAに戻されて評価を行なったようなのだが、「20nm世代はGPUには適さない」という判断が下された模様だ。理由は簡単で「全然性能が出なかった」そうだ。要するに動作周波数がさっぱり上がらなかったらしい。
GPUの場合、動作周波数はやっと1GHzに達する程度で、これはPC向けのCPUはもとよりモバイル向けCPUと比べてもずっと低い動作周波数であるが、その一方でCPUと比べると、同時に動く回路の比率は極端に高くなる。
したがって、CPUのようにホットスポット(回路が高速動作することで消費電力が増え、発熱が急激に増す場所)が何ヵ所かに集中するのではなく、それこそダイ全部がホットスポットと言わんばかりの発熱の仕方になる。これはCPUとGPUの消費電力を比較してみれば簡単にわかる話である。
問題は、こうした「ダイ全体がホットスポット」のような発熱の仕方をするケースで、TSMCの20nmプロセスでは動作周波数が全然上がらないことにあるようだ。もともとTSMCの場合、20nmはローパワー/ハイデンシティ向けのプロセスとしておりハイパフォーマンス向けは16nm FinFETを推奨していたためそう不思議ではないのだが、それでもローパワー/ハイデンシティといっても1GHz位の動作周波数は可能とNVIDIAは踏んでいた筋がある。
動作周波数が同程度で維持できれば、あとはプロセス微細化によるシェーダー数の大幅増加により、性能を改善できるというのがNVIDIAの腹積もりだった。ところが実際に動かしてみると、動作周波数が半分でもつらかったらしい。温度が上がると急速に動作周波数のマージンが減ってしまい、消費電力が増える以前にそもそも回らないようである。
結果として何をやっても無駄、ということで3月末~4月頭頃には、20nmを使ったGM204の計画は事実上放棄されてしまった。これにあわせて、同じく20nmを利用する予定のGM206/200も全部白紙に戻っている。
唯一GM208のみ、そのまま開発が進んで製品化されているが、これはモバイル向けの「GeForce 830M/840M」としてのみリリースされている。こちらはなにしろ回路規模が小さい。GeForce 840Mで3 SMM、GeForce 830Mでは2 SMMなので発熱の絶対量が少なく、利用可能だったようだ。
→次のページヘ続く (得意の28nmを再設計し改良)
この連載の記事
-
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ