GTCで判明したGP100のアーキテクチャー　NVIDIA GPUアップデート

2016年04月11日 11時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII.jp

　予想通り、GTC 2016でNVIDIAのGP100コアが発表された。今回はこのGP100の内部アーキテクチャーを主に解説しよう。

2014年～2017年のNVIDIA GPUロードマップ

Pascal世代の想定性能は
単精度で12TFLOPS、倍精度で4TFLOPSあたり

　まず製品全般としてのロードマップであるが、前回のロードマップアップデートからほとんど変わらない。唯一違いがあるのは、どうも製品名は4桁にはならない、つまりGeForce GTX 1080にはならないらしい、ということだけである。

　では、例えばGeForce GTX R80などになるのかS80になるのか、はたまたZ80なのか、といった具体的な話はまだ伝わって来ていない。とりあえず数字4桁の製品名はあまり好ましくはないと考えているのだそうで、数字は3桁に減らさせることになると思われる。

　ちなみにGeForceグレード製品のスペックそのものは相変わらず不明のままで、HBM2/GDDR5X/GDDR5の使い分けかたも、まだ明らかになっていない。このあたりは、もう少し後で論じたいと思う。

　さて、話をGP100に戻そう。昨年6月の話になるのだが、バルセロナスーパーコンピューティングセンターでPACT Cource:Introduction to CUDA Programmingというトレーニングコースが開催された(今年も5月末～6月に開催される)。

　ここで“Innovations and futures of GP memory”というセッションが、NVIDIAのFellowであるManual Ujaldon氏を講師として開催されたのだが、このセッション資料がなかなか興味深いものだった。

　このセッションは、2016年のPascalで3D積層メモリーを採用するという話を前提に、具体的にどんな形で利用可能になるかを論じたものである。

Pascalでは3D積層メモリーを採用する。この情報そのものは既知

2015年の段階の試作品。今回のGTCで展示されたものと比べると、穴の位置や電源回路などに微妙な違いが見られる

　このセッションがおもしろいのは、この時には3D積層メモリーとしてHBMではなくHMCを主に取り上げていたこと、それとPascal世代の性能(単精度で12TFLOPS、倍精度で4TFLOPS)を示していたことだ。

DDR3L-1600とDDR4-3200、それとHMC 1.0を比較するというおもしろい議論。主記憶としてのHMCという位置付けでのメリット/デメリットの議論である

こちらはオンボードメモリー(つまりVRAM)としての特徴を比較したもの

　ただスライド全部を見ても、PascalはHMCを使うとはどこにも書いてなく、単にHMC(ないしこれ相当の3D積層メモリー)を使うと、こんな具合に性能が上がるよ、ということでしかない。

主眼は、3D積層メモリーを利用した場合、演算性能/メモリー帯域がどういう関係になるかを示したもの。KeplerやXeon Phiと比べて、Pascal＋3D積層メモリーは高いバランスを取っていることが示されている

　そもそもこのセッションは、大学など研究機関の研究者に向けて、CUDAを使うことで高い演算性能を利用できるので使ってほしいという無償のものであり、多分にマーケティング要素が含まれているとは言っても、あからさまな嘘はつけない。

　したがって、少なくとも昨年6月の時点におけるPascal世代の想定性能は、単精度で12TFLOPS、倍精度で4TFLOPSあたりを目指していたと思われる。メモリー帯域はHMC 1.0×4と同等の帯域を予定していたというあたりだろう。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

ASCII倶楽部

Amazon売れ筋ランキング「ノートパソコン」（在庫あり）

【Amazon.co.jp限定】HP ノートパソコン 15-fd 15.6インチインテル Core 5 120U メモリ16GB SSD512GB Windows 11 Microsoft Office 2024搭載 WPS Office搭載カメラシャッター指紋認証薄型 Copilotキー搭載ナチュラルシルバー (BJ0M5PA-AAAI)

￥181,469

Apple 2026 MacBook Air M5チップ搭載13インチノートブック：AIとApple Intelligence、13.6インチLiquid Retinaディスプレイ、16GBユニファイドメモリ、512GB SSDストレージ、12MPセンターフレームカメラ、日本語キーボード、Touch ID - ミッドナイト

￥177,333

【整備済み品】富士通ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄ノートPC/第10世代 Core i5-10310U＠1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載ビジネス在宅勤務向けパソコン (メモリ：8GB／SSD：256GB)

￥35,130

ESBOOKノートパソコン【MS Office 2024搭載&Windows 11 Pro】14インチIPS液晶/1920×1080FHDディスプレイカメラ付き/薄型PCノート高性能CPU/初期設定不要/8Gメモリ/無線LAN/大容量SSD/初心者向け・パソコンノート/日本語キーボードフィルム付き/ワイヤレスマウス付き(256G SSD, ローズゴールド)

￥38,999

【整備済み品】中古ノートパソコン富士通 A579/ 15.6型/ 第8世代Core i5-8365U/ 快適メモリ 8GB/ 高速SSD 256GB/ Win11 Pro/MS Office 2019付属/ テンキー・Webカメラ/豊富な接続端子(HDMI, VGA, USB 3.0)/ ACアダプター付属/初期設定済み・届いてすぐ使用可能/ 180日保証

￥22,480

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII.jpからのお知らせ

一覧へ

GTCで判明したGP100のアーキテクチャー NVIDIA GPUアップデート

Pascal世代の想定性能は 単精度で12TFLOPS、倍精度で4TFLOPSあたり

この連載の記事

この記事の編集者は以下の記事をオススメしています

PC ロードマップでわかる！当世プロセッサー事情（目次）

ビデオカード GeForce GTX 1080の“GDDR5X”や“Founders Edition”って何？

PC NVIDIAの新社屋を訪問、NVIDIAらしいポリゴンを組み合わせたデザインが特徴

PC NVIDIA GTCレポ：AI関連機能を大きく取り込んだVolta世代のアーキテクチャを発表

PC AIに特化したVoltaアーキテクチャの「GV100」の中身を詳しく解説

PC 深層学習の性能が10倍になった「DGX-2」を発表 NVIDIA GTCレポ

注目ニュース

ピックアップ

GTCで判明したGP100のアーキテクチャー　NVIDIA GPUアップデート

Pascal世代の想定性能は
単精度で12TFLOPS、倍精度で4TFLOPSあたり

PC
ロードマップでわかる！当世プロセッサー事情（目次）

ビデオカード
GeForce GTX 1080の“GDDR5X”や“Founders Edition”って何？

PC
NVIDIAの新社屋を訪問、NVIDIAらしいポリゴンを組み合わせたデザインが特徴

PC
NVIDIA GTCレポ：AI関連機能を大きく取り込んだVolta世代のアーキテクチャを発表

PC
AIに特化したVoltaアーキテクチャの「GV100」の中身を詳しく解説

PC
深層学習の性能が10倍になった「DGX-2」を発表　NVIDIA GTCレポ