このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情第373回

Geforce GTX 1050 Ti以降はVoltaに注力 NVIDIA GPUアップデート

2016年09月12日 11時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 今週はNVIDIA GPUのロードマップ アップデートをお届けしよう。まずは連載361回以降の製品アップデートから話をする。

2014年~2016年のNVIDIA GPUロードマップ

 いきなり前回のロードマップ図の訂正だが、GP104コアにはNVLinkが完全に省かれており、Multi-GPUの手段はSLIブリッジ経由ということが明らかになった。前回は「NVLink数削減?」と表現していたが、NVLinkそのものがない形になった。

 もっともNVLinkを使おうとすると、基板上に別のインターコネクトを用意する必要が出るため、現実問題としてはコンシューマー向けとしては妥当な手段だろう。

 ちなみにその大元になったGP100を搭載するTesla P100であるが、こちらは複数のバリエーションがあることも明らかになった。

 もともとGTCなどで発表されていたのはMezzanineカードタイプのもので、こちらはI/FにNVLinkを持つ(おそらくはNVLinkと一緒にPCI Expressの信号も通っていると思われる)タイプであるが、これに続きPCI ExpressカードタイプのP100も発表された。

最初に発表されたTesla P100。背面写真にコネクター部が見えている
PCI ExpressカードタイプのTesla。シャーシに格納することを前提に、冷却ファンは持たない構成

 データシートによればMezzanineカードタイプのものもPCI Expressカードのものも、シェーダー数(CUDAコア数)は3584であり、単精度での演算速度がMezzanineカードが10.6TFlops、PCI Expressカードのものが9.3TFlopsとされる。

 ここから逆算すると、Messanineカードタイプが1480MHz程度、PCI Expressカードタイプが1300MHz程度の動作周波数と考えられる。

 またPCI Expressカードタイプには16GBのものと12GBのものがあるが、16GBのものが720GB/秒のメモリー帯域なのに対し、12GBのものは540GB/秒に帯域が減らされており、これは素直にHBM2のスタックが3つのみに減らされたと考えられる。

 さて、Messanineカードタイプは、オークリッジ国立研究所のSummitと、ローレンス・リバモア国立研究所のSierra向けが最初のターゲットである。

 ここは最終的にはPower9+Voltaという構成になるという話は連載340回でも書いたが、その前段階としてPower8とKeplerのシステムがまず導入される。

 それに続き今年度にはCAPI I/FがNVLink対応となったPower8+とP100のシステムが導入、2017年度にはいよいよPower9と、予定が順調ならVoltaベースのTeslaが納入される。

現状ではVoltaもPower9も存在しないので、この通りに行くかは不明

 ただこれはIBMのPowerベースのサーバーと組み合わせるのは問題ないが、従来タイプのサーバーではNVLinkのI/Fを電気的にも物理的にも持っていないため、PCI Expressカードタイプも当然必要になる。

 もちろん多数のTesla P100を利用する構成では、例えば下の画像のような形での接続も可能で、必ずしもMessanineカードタイプでは、インテルのCPUと組み合わせできないわけではないが、もう少し小規模なシステムを望む場合にはやはりPCI Expressカードの方が好ましいだろう。

これはNVIDIAの発売するDGX-1の構成そのものと思われる

 ちなみに、PCI Expressカードタイプの動作周波数がやや低くなっているのは、おそらく冷却の都合と思われる。

 後述するGeForce Titan XはTeslaと異なり冷却ファンを持つ構成だが、連続稼動させているとしばしばThermal Throttling(温度が高くなりすぎるのを防止するために、動作周波数を自動でやや落とす仕組み)が発生し、ピーク性能が出ないという。

 これはPCI Expressカードに収めるためにヒートシンクの体積に縛りがあり、放熱が十分でないことから発生する。このあたり、Messanineカードの方が冷却的には有利(少なくともPCI Expressカードのような「ガワ」がないだけでもだいぶ効率が良い)というあたりに起因すると思われる。

前へ 1 2 3 次へ

この連載の記事

注目ニュース

ASCII倶楽部

最新記事

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン