このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第311回

スーパーコンピューターの系譜 GPGPU利用を加速させるNVIDIA

2015年07月06日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 今回のスーパーコンピューターの系譜は前回の続きでNVIDIAのGPUである。GeForce 8000シリーズ、あるいはG80世代というべきかもしれないが、この世代でGPGPUに名乗りを上げたNVIDIAだが、いきなりこれでGPGPU全盛になった、というほど話は簡単ではなかった。

G80世代の代表作「GeForce 8800 GTX」

 G80世代の最初の製品は、2006年11月に投入された「GeForce 8800 GTX」である。こちらの記事の写真にもある通り、G80コアでは16個のSP(Streaming Processor)を1つのブロック(SPA:Streaming Processor Array)とし、これを8つ並べた形である。チップ全体としては128SPという計算になる。

GeForce 8800 GTXの構造。シェーダーが完全に均質化(Unified)されている。2007年のHotChips 19でNVIDIAのErik Lindholm氏とStuart Oberman氏が発表した“The NVIDIA GeForce 8800 GPU”のスライドより

 各々のSPAの中は下の画像のように構成されている。テクスチャーユニットが配されるのは、まだGPGPUとしての用途よりもGPU用途が多いからで、これに2つのSM(Streaming Multiprocessor)が組み合わされる。

SPAの構造。SPあるいはSFUの演算は、SM内のShared Memoryに対して行なう。これをL1/L2経由でメモリーに書き戻す

 各々のSMは8つのSPと2つのSFU(Special Function Units)から構成される。1つのSPは32bitのMAD(Multiply-Add)ユニットで構成されるもので、整数演算とIEEE754に準拠した32bitの浮動小数点演算が可能である。

 このMADユニットは名前の通り加算と乗算が可能なもので、逆に言えばそれしか出来ない。実際実行できるものはADD/MUL/MAD(Multiply-Add)/MIN/MAXといった演算に限られる。

 ただ、GPUやGPGPUに求められる演算の大半がこれで済むとは言え、これ以外の計算も時には求められる。それを実行するのがSFUで、RCP/ESQRT/LOG/EXP/SIN/COSといった特殊な演算や値の補完、これを応用した逆数の計算などが実行できるようになっている。

 さて話を戻すと、2つ上の画像では8つのSPAとそれ以外では、動作周波数が異なっている。GeForce 8800 GTXの場合、コア全体(SPA以外)は575MHz動作なのに対し、SPAは1350MHz駆動となっており、2.34倍というやや変則的な周波数比である。

 この比は一定ではなく、だいぶ後に登場する「GeForce 8800 GT」(G92コア)ではそれぞれ600MHzと1500MHzで2.5倍設定となっている。要するにかなり自由に設定できるようになっているわけだ。なぜこのような複雑な方式を取ったかはいくつかの要因が考えられる。

 G80はNVIDIAにとって初めてのGPGPU構成の製品であり、GPGPUに使うときにシェーダーとメモリー、周辺回路がどのような頻度で使われるかは完全に読みきれなかった。

 ただ、もともとDirectX 10のUnified Shader化により、GPU側は1つのシェーダーコア(上の画像で言うところのTPC)がひたすらブン回る構成を考えていた。

G80は1つのシェーダーコアがひたすらブン回る構造になっている。実際にどの程度ブン回るかは設計時点では読みきれていなかったようだ

 こういう場合では実装の方法は2つあり、下のどちらかになる。

  • Unified Shader 4つをそれぞれShader A/B/C/Dの役目に割り当てるパイプライン方式
  • 1つのUnified Shaderを4倍速でブン廻す方式

 G80の場合、シェーダー数そのものは128とそう多くないため、パイプライン方式では間に合わないと判断したのだろう、ぶん回し方式を取るのはある意味必然とも言える。加えて言えば、G80の世代は90nmプロセスで製造されていたが、当時のTSMCの90nmでGPU全体を1GHz以上でブン廻すと、消費電力がかなり大きくなることも考えられた。

 それにメモリーコントローラー(GDDR3 900MHz)や2次キャッシュなどは別に1GHzを超える速度でブン廻す必要は皆無であり、500~600MHzで十分間に合う程度だった。このあたりも、設計のバランスを考えると分離して別々の速度で動かすのがリーズナブルと考えられた。

→次のページヘ続く (G80世代では思った性能が出ない

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
¥1,890
2
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
¥2,880
3
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥740
4
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
¥990
5
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
¥1,100
6
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ブラック T-K6A-2630BK
エレコム 電源タップ 6個口 3m 雷ガード 個別スイッチ ほこりシャッター付 耐熱 PSE技術基準適合 ブラック T-K6A-2630BK
¥2,111
7
【Amazon.co.jp限定】バッファロー microSD 128GB 100MB/s UHS-1 U1 microSDXC【 Nintendo Switch 対応 】V10 A1 IPX7 Full HD RMSD-128U11HA/N
【Amazon.co.jp限定】バッファロー microSD 128GB 100MB/s UHS-1 U1 microSDXC【 Nintendo Switch 対応 】V10 A1 IPX7 Full HD RMSD-128U11HA/N
¥3,080
8
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
¥4,918
9
CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電 平型 磁石 マグネット吸着 まとまる 充電ケーブル PD 240W データ転送 480Mbps (ライトブラック, 1m)
CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電 平型 磁石 マグネット吸着 まとまる 充電ケーブル PD 240W データ転送 480Mbps (ライトブラック, 1m)
¥1,980
10
エルパ(ELPA) 扉付タップラン 電源タップ 延長コード 125V 3m 3個口 ホワイト WBT-N3030B(W)
エルパ(ELPA) 扉付タップラン 電源タップ 延長コード 125V 3m 3個口 ホワイト WBT-N3030B(W)
¥652

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン