発想は先進的でも実装に問題あり
消費電力増大でドライヤー呼ばわり
NVIDIAの想定したコンセプトはともかく、NV30の実装にはいろいろ問題があった。一般論であるが、CPUを含めた演算器のユニットの中で、一番消費電力を食うのはデコーダーというのが相場である。特にデコーダーの同時命令処理数が大きいほど、(指数級数的にとまでは言わないが)2次関数的に消費電力が増えてゆく。そのため同時命令処理数が大きいほど、消費電力の点では不利になる。
また図2のようなケースでは、デコード後のスケジューラーにも負荷が掛かる。「どうPUを組み合わせるか」という処理が、図1のケースに比べると格段に増えるためだ。そんなわけでアーキテクチャー的にはどうしても、消費電力が増えやすい構造となる。
またNV30は、製造プロセスにTSMCの0.13μmプロセスを使った比較的初期の製品であるが、このTSMCの0.13μmプロセスというのがいろいろトラブルが多かった※1。当初はプロセスの安定化に必死だった時期であり、まだリーク電流削減まで手が回っていなかったから、そうでなくても多い消費電力が、さらに多くなることになった。
※1 同じTSMCの0.13μmを使ったTransmetaの「TM5800/5500」が苦戦した話はこちら。
消費電力の話で言えば、このNV30を初めとするGeForce FX世代は、NVIDIAに買収された3dfxのチームが手がけた製品でもある。3dfxの製品、特にGPU黒歴史の1本目で扱った「VSA-100」の消費電力が多かったのは、ひとつにはチップの物理設計であまり省電力を考えてなかったこともあると思う。ひょっとすると、NV30でそれが再び繰り返された可能性も否定できない。
おまけにNV30は、NVIDIAとしては初めてGDDR2を採用することで最大1GHzのデータレートを確保したが、このGDDR2が当時はかなり消費電力が多く、さらにカード全体の消費電力を引き上げる結果となった。
結果として、NV30を搭載したGeForce FX 5800は、同程度の性能を発揮したRADEON 9700と比較して、ほぼ倍の消費電力と言われることになった。当然その分発熱が増えるわけで、これをカバーするために2スロット厚のヒートシンクと、これを十分に冷やすための「FX Flow」という冷却機構を考え出した。そのFX Flowに使われるモーターの騒音が半端でなかったのは、冒頭のビデオを見ていただければおわかりのとおり。まさしくドライヤー並の騒音を立てていた。
こんな製品に仕上がってしまった以上、ユーザーの支持はほとんど得られない。そこでNVIDIAはNV30を大急ぎで改良し、半年後には「NV35」となる「GeForce FX 5900」をリリースする。
消費電力が増えたのは、1つのシェーダーに含まれるデコーダーやらスケジューラーの幅が広すぎたためで、これを狭める代わりにシェーダーの数を増やし、また動作周波数を若干引き下げることで消費電力を引き下げた。メモリーに関しても、データレートを落とす代わりにバス幅を倍増することで、リーズナブルな消費電力と強化された帯域の両方を手に入れた。
こうした修正は、Cine FX本来のコンセプトからするとやや後退ではあるものの、どのみちこの時点でNV30のCine FXの能力をフルに生かしたプログラムは皆無であったから、現実に支障はなかった。そのうえ発熱と消費電力が抑えられたために、より多くのユーザーに使ってもらえるようになったから、それはそれでハッピーであった。
幸いだったのは、より下位グレードの「NV31」(GeForce FX 5600)や「NV34」(GeForce FX 5200)では、同時に割り当てる命令数が減らされていたために、それほど消費電力の問題がシビアでなかったことだ。メモリーもこなれたGDDRだったから、こちらの発熱もそれほど問題ではなかった。
かくして2003年には、GeForce FX 5800はなかったことにされてしまった。おまけに、続く「NV40」世代では、GeForce FXの構造そのものが捨てられてしまい、ATI的というか、従来の延長線にあるような内部構造に戻ったなど、NVIDIAにはいい教訓を残したのかもしれない。それにしても、NVIDIA自身がドライヤーだのコーヒーメーカーだのと自嘲せざるをえないほど凄まじい製品だっただけに、黒歴史入りするのは当然と言えよう。
この連載の記事
-
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 - この連載の一覧へ