スーパーコンピューターの系譜　今後のGPGPU利用の方向性

2015年08月17日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII.jp

新しい外部I/Fで帯域を確保する
NVIDIA

　NVIDIAはHPCに関してインテルを捨て、IBMと組むという戦略に出た。もともと同社はARMからアーキテクチャーライセンスを取得し、Project Denverと呼ばれる64bit ARMベースの独自CPUを開発しており、一時期はこれがHPC向けに使われるという噂もあったが、結局Project DenverのコアはTegra K1などのモバイル向けに利用されることになった。

　となると、少なくともKnights Landingのようなな解決法を行なうためには手頃なCPUコアがない。またそもそも同社のCUDAがホストベースの構成を前提としたものだったため、いきなり超並列のような構成を取ることはできない。

　かといってインテルベースのプラットフォームを使う限り、PCI Expressベースになるから性能がここで頭打ちになる。技術的にはインテルがQPIのI/Fをライセンスしてくれれば、もっと高速で、しかもキャッシュコヒーレンシが利用できることになるが、インテルがこれを公開しない以上どうしようもない。

　その一方、IBMは2014年4月にPower8というハイエンドプロセッサーを発表したが、このPower8は外部通信I/Fとしてこれまで利用してきたPCI Expressに代えて独自のCAPI(Coherence Attach Processor Interface)と呼ばれるポートを装備した。

　これにあわせてNVIDIAはNVLINKと呼ばれる新しい外部I/Fを発表、Pascalの世代から搭載することを明らかにした。このNVLINKはGPUとホスト、あるいはGPU同士を接続するために利用可能とされ、帯域は80～200GB/秒になるとしている。

　これだけ帯域が大きければ、ホストとの同期がボトルネックになる可能性はだいぶ下がることになる。

NVLINKは、CPUと直接接続しメモリー内容などを転送し、CPUとGPUのメモリを統一して扱うユニファイドメモリーを実現する。CPUから直接NVLINKを出力することになるため、現時点では、専用のPowerプロセッサーだけが対応する

HSAをHPC市場に持ち込むつもりの
AMD

　さて、ではAMDは？という話である。AMDの場合は、APUの実装を優先した関係で、GPGPUカードとホストの連携はあくまでも通常のPCI Express経由という扱いだったが、Kaveri世代で一応HSAの実装がフルに完了したこともあり、再びHPC市場に目を向けつつある。

　IEEEの学会誌の1つであるIEEE MicroのVol 35 Issue 04(2015年7-8月号)は、“Heterogeneous Computing”という特集であるが、ここにAMDは10人もの筆者を集めて“Achieving Exascale Capabilities through Heterogeneous Computing”という記事を掲載している(関連リンク)。

　下の画像はその概念図を示したものだが、同社のAPUコア(論文の説明ではARMもしくはx86ベースだそうだ)とGPU、そしてDRAMを全部シリコンインターポーザーに搭載するという形を想定している。要するにRadeon R9 Furyのもっと大規模、そしてCPUコアも載っている版である。