このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第308回

スーパーコンピューターの系譜 GPUをアクセラレーターに活用したClearSpeed

2015年06月15日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

TSUBAME 1.0に採用された
CS301の後継「CSX600」

 2年後の2005年11月に開催されたSC05で、同社はCSX600を披露する。CSX600は、まずPEの数を96+8個に増やしたうえ、各々のPEで倍精度浮動小数点を扱えるように改善した。また動作周波数もやや引き上げて250MHzを目指している。

CSX600を発表。これは2004年に同社の当時のCTOであったRay McConnell氏が発表したスライドより。最終的には、ここに記されたスペックはほぼ製品に引き継がれた

 とはいえ、最終的には210MHzになったのはCS301と同じくIBMの0.13μ FSGプロセスを使ったからであろう。この結果ピーク性能は50GFLOPSではなく40.32GFLOPSになっている。

 外部メモリーはECC付きのDDR2になった。ちなみにPEの96+8個というのは、8個の冗長PEが用意されている(プログラムから使えるのは96個のみ)の意味である。

 実際に利用する際には、チップ単体ではなく下の画像のように2つのCSX600が搭載された拡張カードをホストに装着することになった。

CSX600は拡張カードをホストに装着する形で利用する。左がPCI Express x8、右がPCI-XのI/Fだが、違いはI/Fのみである

 当時はまだサーバー用途にはPCI-Xを使うケースも多く、それもあって2種類のカードが提供された。ちなみにヒートシンクが付いているのはI/Fを担うFPGAチップで、CSX600そのものはヒートシンクなしで動作する程度の消費電力であった。

 もっとも放熱性の高いメタルパッケージだったからOKという話であって、安価なプラスチックパッケージを使ったら間違いなくヒートシンクが必要だっただろう。

 さて、そのCSX600はどうだったのか? 上の画像にもあるように、1チップで40.32GFLOPS。2チップ構成では80.64GFLOPSの性能をたたき出すとされ、これは当時のいかなるアクセラレーターよりも高速であった。

 これもあり、東京工業大学では松岡聡教授が中心となって構築されたTSUBAME 1.0にこのCSX600が採用される。TSUBAME 1.0は655ノード・5240プロセッサーのOpteron Dual Core(2.4GHzないし2.6GHz)に360枚(後に648枚に増設)のCSX600アクセラレーターカードを組み合わせたハイブリッド構成となった。

 このTUBAME 1.0のTOP500にレポートされた成績を見てみると以下のようになっている。

TUBAME 1.0の成績
時期 実効性能 理論性能 TOP500順位
2006年6月 31.18TFLOPS 49.87TFLOPS 7位
2006年11月 47.40TFLOPS 78.80TFLOPS 9位
2007年6月 48.90TFLOPS 82.10TFLOPS 14位
2007年11月 56.43TFLOPS 102.02TFLOPS 16位

 2006年6月の結果はOpteronのみのもの、次の2つがCSX600を360枚増設した状態の結果、最後の2007年11月のものがCSX600を648枚まで増やした結果と思われるが、CSX600は理論性能こそ跳ね上がるものの、実効性能があまり上がらないことがわかる。

 これはなぜか? という問いに対する間接的な回答は、東京工業大学自身が公開している。同大学が公開しているTSUBAME ESJのVol.2には「TSUBAME 2.0始まる TSUBAME 1.0 から2.0への長い道のり(前編)」という記事が掲載されており、この中でTSUBAME1の光と影と題した文章が含まれている。

 正確にはこの文章をお読みいただくのが良いと思うが、メリットとして大規模な密結合の行列演算は、ライブラリーの指定とコマンドラインオプションだけで性能が倍以上になったものの、逆に密結合の行列演算以外に関してはプログラミングが困難・メモリーバンド幅不足・メモリー容量不足の三重苦でほとんど活用できなかったとのことだ。結局TSUBAMEはこのあとNVIDIAのGPUの活用に急速に切り替えていくことになる。

 話をCSX600に戻すと、結局ClearSpeedは東京工業大学以外に大きな顧客を捕まえることはできなかった。同社はさらなる性能改善を目指し、CSX600×2+PCI Experss x16 I/Fをワンチップに収めたCSX700を2008年に発表する。

CSX700

 プロセスは同じIBMの90nmプロセスに微細化されたが、動作周波数は相変わらず250MHzどまりで、それほど性能を上げることはできず、こちらを採用した例もほとんどなかった。

CSX700のデータシートよりブロック図を抜粋。もうまんま、CSX600を2つ収めた格好であり、メモリーバスも2つになっている

 これとは別に、同社はBAE SystemsにCSX600をライセンス供与、BAE Systemsはこれを利用してRADSPEEDという耐放射線強化版のCSX600を作成、航空宇宙分野に向けて提供している。こちらは主要な顧客が軍関係ということもあって詳細は不明だが、少なくともClearSpeedの業績を支えるほどは売れなかったようだ。

 2009年に同社は大規模なリストラを行ない、同時にCEOも辞任。6月には上場も廃止、2010年には米国オフィスも閉鎖している。といってもまだ同社は存続しており、CSX700の製品ページすらある。FAQページによれば、まだ同社からCSX700を購入することは可能らしいが、すでにSDKなどのサポートはすべて終了しており、どこまで意味があるのかは謎である。

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン