NVIDIAは、3月25日からGPU Technology Conference(GTC)を開催した。初日の基調講演には、創業者でCEO兼社長のジェンセン・ファン氏が行なった。
GPUのボトルネックはCPUーGPU間
新たな技術で接続する
ジェンセン氏は、最初にGPUのボトルネックについて話を始める。引用されたのはGPUを用いたスパコン「TSUBAME」で知られる東工大・青木尊之教授の論文だ。ボトルネックはCPUとGPUの接続にあったのだ。それぞれに高速でアクセスできるメモリがあるものの、GPUによる汎用演算では、GPU-CPU間でデータを交換する必要があり、そこがボトルネックになっていたのだという。
それに対するNVIDIAの解答がCPUとGPUを直接接続するNVLINKだ。NVLINKは差動回路、埋め込みクロックを使う高速なシリアル接続技術で、最大でPCI Expressの12倍の転送速度があるという。プログラミングモデルとしてはPCI Expressと同じ(つまりほとんどPCIと同じ)であり、OSなどへの対応も容易になるという。
このNVLINKを使うことで、CPUとGPUのメモリを統一して扱う「ユニファイド」メモリが可能となるのだが、第一世代のNVLINKには、キャッシュの一貫性を保つためのプロトコルは含まれず、第二世代での実装になる予定だ。CPUから直接NVLINKを出力することになるため、現時点では、専用のPowerPCプロセッサだけが対応するという。
このNVLINKを使う、MAXWELLの次のGPUアーキテクチャが「PASCAL」だ。PASCALは、GPUーCPU間をNVLINKで接続し、基板上に3次元メモリを搭載したモジュールとして提供される。当初は、TESLAのような科学技術演算などに利用する高性能システム用として使われると思われる。ただし、現時点では、PASCALの内部アーキテクチャに関してはなにも公開されておらず、どのような構成になっているのかは不明だ。一方で性能としては、現在のMAXWELLの1.7倍弱程度だとされている。
次期ハイエンドカード「TITAN Z」を公開
次に発表されたのは、2999ドルのグラフィックスカード「GeFORCE GTX TITAN Z」だ。GK110をデュアルで搭載し、演算コア数は5760個、8テラFLOPSで12ギガバイトのメモリを搭載する。これは、画像認識処理のような汎用演算用やプロフェッショナル向けのグラフィックスでの利用を想定している。
さらにレイトレーシングなどにより高度なリアリティを持ったグラフィックスを作成するための「レンダリングアプライアンス」としてIRAY VCAも発表された。これは、Kepler GPUを搭載したモジュールを内部に追加することで性能をスケーリングできる製品。デモでは、実際に撮影した写真と、建築データなどから生成したグラフィックスが提示されたが、簡単には見分けが付かないレベル。両方を並べて、どっちが本物なのかと聞かれると見分けることも不可能ではないとおもうが、グラフィックスのほうだけを見せられたら普通の写真と区別がつかないだろう。
この製品は、製品デザインなどにも利用可能で、別のデモでは本田技研の自動車設計のデータをレンダリングしたものが使われた。一見、写真のような画像だが、設計データからのものであるため、たとえばカットモデルのように半分に切った状態にすることもできる。システム価格としては5万ドルである。
さらに、NVIDIAのGPU仮想化技術について、VMWare社がこれにHorizon DaaS Plaformで対応することが発表された。Horizon DaaS(Desktop As A Service)は、vCloudサービスの上に構築された仮想デスクトップサービス。簡単にいうと、ネットワークを介して、コンピュータの実行環境(デスクトップ環境)を提供するもの。GPUを利用したアプリケーションをクラウド側で動作させるためにGPU仮想化技術に対応したとのことだ。