「Kepler」とは、NVIDIAの新GPU「GeForce GTX 680」から採用された、新アーキテクチャーのコードネームである。ちなみにGTX 480から採用された前世代は、「Fermi」アーキテクチャーと呼ばれていた。
従来のFermiよりもトータルパフォーマンスを向上させつつ、消費電力を抑えているのがKeplerの特徴だ。
トランジスター数は微増で
性能が大幅向上した秘密とは?
昨年開かれたゲーム開発者向け国際会議「GDC2011」で披露された「Samaritan」と呼ばれるグラフィックデモは、3枚のGTX 580を使って実現されていたという。一方、2012年3月に開かれた「GDC2012」では、これを1枚のGTX 680で実現した。Fermi世代のGTX 580を3枚使うと、消費電力は732Wも必要なのに対して、GTX 680ならば1枚で195Wに抑えられている。
GTX 580は40nmプロセスで製造され、ダイサイズは520mm2、30億トランジスターだったが、GTX 680は28nmプロセスで294mm2、35.4億トランジスターになった。最近のNVIDIAチップは、世代が変わって製造プロセスがシュリンクされても、トランジスター数が増えてダイ面積があまり変わらない傾向があった(関連記事)。しかしGTX 680では、大幅にサイズを縮小しながら、トランジスター数は2割増し程度だ。
その一方で、内部演算ユニットである「CUDAコア」の数は、大幅に増えている。GTX 580は「SM」(Streaming Multiprocessor)を16用意し、1つのSMにCUDAコアを32搭載していた。これに対してGTX 680は、「SMX」(Streaming Multiprocessor eXtreme)に強化して8つ用意し、1つのSMXにCUDAコアを192搭載した。つまり、GTX 580には512のCUDAコアがあったのに対して、GTX 680は1536のCUDAコアが用意されている。CUDAコア数だけで言えば、3倍も搭載したことになる。
トランジスターは20%増しなのに、コア数が300%と言うことは、KeplerのアーキテクチャーはCUDAコアのトランジスター数を、大幅に抑えた構造になったと言っていい。例えばFermiまでは、ハードウェアで命令実行のスケジューリングを行なっていた。しかしKeplerではドライバーソフト側にある程度任せて、命令スケジューリングのハードウェアを減らしている。
このように内部構造を単純にしたことで、少ないトランジスター数でCUDAコアを作ることができ、より多くのコアをチップ内に搭載できるようになった。一方で、構造変更によってもCUDAコアの性能はさほど低下していないので、結果として高い性能を低い消費電力で実現できるというのが、Keplerアーキテクチャーの最大の特徴と言えるだろう。
この連載の記事
-
第12回
PC
「レアアース」モーターからガラスまで PCにも重要な資源 -
第11回
PC
「IMES」建物内のどこにいるかまでわかる位置情報技術 -
第10回
PC
「MRAM」NANDフラッシュを置き換える?新不揮発メモリー -
第9回
PC
「IEEE 802.11ac」Gbps級の速度を実現する新無線LAN規格 -
第8回
PC
「GeForce GRID」最新3D CGゲームがクラウド上で遊べる? -
第7回
PC
「熱アシスト記録」1プラッタ1.5TB超を実現するHDD記録方式 -
第6回
PC
「マグネシウム・リチウム合金」軽量LaVie Zを実現した新素材 -
第5回
PC
「ゴリラガラス」スマホを包む化学強化ガラスの秘密 -
第4回
PC
「インセル型タッチパネル」スマホを薄型化するセンサー -
第3回
PC
「MCP」大容量microSDHCに欠かせない高密度実装技術 - この連載の一覧へ