前へ 1 2 3 次へ

スーパーコンピューターの系譜　Teslaで確固たる地位を築いたNVIDIA

2015年07月13日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII.jp

FermiからKeplerへ
さらに演算が高速化

　Tesla M2090に続きNVIDIAはKeplerアーキテクチャーをリリースする。最初に発表されたのはコンシューマー向けのGK104で、これはGeForce GTX 680として2014年4月に製品投入される。

GK104を採用するGeForce GTX 680

　ただこのGK104はGPGPU用途はあまり考慮されていないものだった。具体的には、倍精度の浮動小数点演算ハードウェアが搭載されず、またメモリーや2次キャッシュにおけるECCのサポートも省かれていた。

　とはいえ、性能そのものは大幅に改善されている。下の画像はNVIDIAがリリースしたGeForce GTX 680のホワイトペーパーからの抜粋だ。

こちらはそれぞれのチップ同士での比較。Fermi世代まで実装されていた、コア全体とシェーダーが別々の速度で動く実装方式はこの世代で廃された

シェーダー1個あたりの絶対性能そのものはFermiもKeplerも同じであるが、ポイントはより簡単な構造でありながら同一の性能が出せることで、そうなるとよりシェーダー数を集積して動作周波数を上げる方が有利になる

　左の画像はチップ単体としてはFermiと比較してずっと消費電力を下げつつ、性能は倍増していることが示されている。右の画像は内部のコアの詳細であるが、色々と手が入っていることがわかる。

　もっともFermiからKeplerへの変更はそうした表向きの部分ではなく、むしろシェーダー(NVIDIA用語で言うところのCUDAコア)の構造を簡単化することでシェーダー密度を上げたことの方が大きい。

　具体的にはSM(Streaming Multiprocessor)内部の命令デコーダーやスケジューラーの構造が簡素化され、これまでハードウェア側で行なっていた制御の大半はソフトウェアに移された。

　これは逆に言えばプログラミング(GPUであればデバイスドライバー、GPGPUであればCUDAで開発すると自動的に組み込まれるプリスケジューラー)が複雑になるわけだが、そうしたオーバーヘッドを増やしても、シェーダーの数そのものを増やしたほうが得策と判断されたわけだ。

　またKepler世代では28nmプロセスに移行したことで、コア全体がそれなりの速度で動作する。1GHzクラスまで動作周波数を引き上げても消費電力が極端に増えたりしないと判断されたことで、シェーダーがコア全体と同じ速度で動作するようになった。

　この結果、シェーダーは以前ほど高速動作させる必要がなくなり、これにあわせてパイプライン段数を減らしている。これはシェーダの実装に必要なトランジスター数を減らすことにつながり、結果としてシェーダの数をより多く実装できるようになった。

　さて、GK104そのものはGPGPU用途を考慮していないと書いたが、KeplerアーキテクチャーはもちろんGPGPUを十分考慮しており、ここからGPUに必要な部分だけを抜き出したのがGK104で、GPGPU用途に向けて作られたのがGK110コアである。

GK110を採用するTesla K20

　このGK110は2012年の5月に、Tesla K20/K20X向けとして発表され、同年11月に発売された。このGK110と既存の製品を比較したのが下の画像である。

GK110と既存製品の比較。このレベルで見るとGK104とGK110の間に大きな差はない

　ここで挙げられているDynamic ParallelismやHyper-Qについては、以前GeForce GTX TITANの説明の際に紹介したので今回は割愛するが、これらはいずれもGPGPU向けの機能となる。

　またGK104との大きな違いとして、1つのSMXの中に192個のCUDAコアの他、64個のDP Unit(倍精度演算ユニット)を搭載しており(Photo04)、これで大幅に浮動小数点演算性能を改善しているのが特徴である。またメモリーや2次キャッシュにECCの保護機能も搭載された。

GK110の構造。CUDAコアとは別にDP Unitを設けるあたりは無駄な気もしなくはないのだが、これを両方で使えるような複合型にすると、GK104のように「倍精度がいらない」というニーズでの切り離しが面倒になるためであろう

→次のページヘ続く　（オークリッジ国立研究所のTitanが現役稼働中）

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

この連載の記事

PC
ロードマップでわかる！当世プロセッサー事情（目次）
PC
Top500更新、スーパーコンピューターでTeslaの採用が拡大
サーバー・ストレージ
グラフィック面で厳しいVDIをNVIDIA GRIDは救えるか？

ASCII倶楽部

Amazon売れ筋ランキング「ノートパソコン」（在庫あり）

【整備済み品】富士通ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄ノートPC/第10世代 Core i5-10310U＠1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載ビジネス在宅勤務向けパソコン (メモリ：8GB／SSD：256GB)

￥39,800

【整備済み品】中古ノートパソコン NEC VersaPro VKT16/15.6型・第8世代Core i5-8250U(最大動作3.4GHz)/快適メモリ8GB/ 高速SSD 256GB/Win11 Pro/MS Office 2019付属/テンキー付, Webカメラ, USB3.0, HDMI, VGA, 有線LAN, WIFI内蔵, Bluetooth/ACアダプター付属/180日間保証

￥26,880

【整備済み品】富士通 2in1ノートパソコン V727【本体のみ】／第7世代Core M3／12.3型タッチパネル1920×1080／メモリ 8GB／SSD 128GB／Win 11／MS Office 2019／USB 3.1／Type-C／無線WIFI／オーディオ内蔵／WEBカメラ／初期設定済

￥9,600

Lenovo Chromebook クロームブック IdeaPad Flex 3i Gen8 12.2インチインテル® プロセッサー N100搭載メモリ4GB eMMC 64GB バッテリー駆動12.0時間重量1.25kg アビスブルー 82XH001KJP

￥29,800

【Amazon.co.jp限定】 ASUS ノートパソコン Vivobook 15 X1502VA 15.6インチインテル Core i7 13620H メモリ16GB SSD 1TB Windows 11 バッテリー駆動 8.9時間重量1.7kg PC Game Pass 3ヶ月利用権付きクワイエットブルー X1502VA-I7H161W

￥104,800

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII.jpからのお知らせ

一覧へ

スーパーコンピューターの系譜 Teslaで確固たる地位を築いたNVIDIA

FermiからKeplerへ さらに演算が高速化

この連載の記事

この記事の編集者は以下の記事をオススメしています

PC ロードマップでわかる！当世プロセッサー事情（目次）

PC Top500更新、スーパーコンピューターでTeslaの採用が拡大

サーバー・ストレージ グラフィック面で厳しいVDIをNVIDIA GRIDは救えるか？

注目ニュース

ピックアップ

スーパーコンピューターの系譜　Teslaで確固たる地位を築いたNVIDIA

FermiからKeplerへ
さらに演算が高速化

PC
ロードマップでわかる！当世プロセッサー事情（目次）

PC
Top500更新、スーパーコンピューターでTeslaの採用が拡大

サーバー・ストレージ
グラフィック面で厳しいVDIをNVIDIA GRIDは救えるか？