このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第323回

スーパーコンピューターの系譜 最後のベクトルマシンとなったCray X1

2015年09月28日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

SV2がCray X1に生まれ変わる

 SV1exに続く形でSV2という製品が予定されていたのは、前ページのSV1のロードマップにも掲載されているし、連載279回でも説明した通りだが、このSV2という名前は開発コード名としては残りつつ、製品としてはCray X1という形に生まれ変わることになった。

Cray X1の外観。2002年におけるCray X1のカタログより抜粋

 昔のロードマップのスライドを見ると、SV2という製品はT90やJ90/SV1/SV1eといったベクトルプロセッサー、それとT3Eというアーキテクチャーの両方の後継になっているのがわかる。

SGIのロードマップ。SC98でSGIが行なったSV1の製品アップデートのプレゼンテーション資料より抜粋

 もっともこれはSV2だけでなく、旧SGIのOrigin系列にも言える話で、初代のOrigin(Origin 200/2000)とSN1(Origin 300/3000)に続くSN2はやはりT3Eの特徴を引き継いだものになる予定であり、実際同社はこれをItaniumベースのSN-IPFという形でやはり2002年に発表した。

 要するに元のロードマップは、CrayのベクトルプロセッサーとSGIのMIPSベースプロセッサーの系列に、CrayのT3D/T3Eのアーキテクチャーを融合させよう、という発想であり、これはCrayのSGIからのスピンアウト後も変わらずに進むことになった。このあたりを端的に示したのが下図である。

Cray UKのDavid Tanqueray氏(Application Consultant)が2002年に発表したプレゼンテーションから抜粋。T3Eのメモリー共有メカニズムやプロセッサー同期メカニズム、高速ネットワークなどの特徴をSV1に組み合わせたのがX1という説明である

 Cray X1の内部構造であるが、プロセッサーそのものはSV1の延長にある。異なるのは、4つのベクトルプロセッサーで2MBのキャッシュを共有するように改められたことだ。

この図はオークリッジ国立研究所の“Performance Evaluation of the Cray X1 Distributed Shared Memory Architecture”という論文からの抜粋。MSPを前提にするなら共有キャッシュの方が効率的なのは理解できる

 コアの動作周波数は800MHzまで引き上げられ、1つのベクトルプロセッサーで3.2GFLOPS、これを4コア搭載するMSPモジュールでは12.8GFLOPSに達する。ちなみに各々のSSP(Single Stream Processor)の中の“S”(Scalar Unit)は400MHz動作で、“V”(Vector Unit)が800MHzになっている。

 このMSPを4つ搭載した16CPUの構成(Crayの用語ではNode Module)が最小構成とされる。

SV1との最大の違いは、キャッシュがCPUと分離されたこととしてもいいだろう。出典は先と同じオークリッジ国立研究所の論文

中央のアルミ板の下にCPUを搭載したMCMが実装される。これより先の資料はDavid Tanqueray氏のプレゼン資料より抜粋

ノードモジュールの部品配置。中央にCPU、その両側にメモリー、さらにその外にメモリーコントローラー/ネットワークチップを挟んでインターコネクトのコネクターが並ぶ格好。手前のホースは液冷用のものである

 ちなみに、いかにCMOSを使って微細化したとはいえ800MHzのコア×4を内蔵したMCM(Multi-Chip Module)をさらに4つ搭載するので、空冷では間に合わない。そこでCray X1ではCRAY-2以来となるフロリナートを利用した液冷が採用された。

 といってもCRAY-2なみに回路全体をフロリナートに漬けるのではなく、MCM部と接する厚いアルミの放熱板の中にフロリナートを通す構造になっているようで、メモリーあるいはネットワークチップは空冷のままとなっている。

 ちなみにこのX1ではメモリーとしてDirect RDRAMが採用された。1ノード、つまり上の画像に示される1枚のボード上には32ch/64スロットのRIMMスロットが用意されており、PC800を利用した場合でボード1枚あたり51.2GB/秒の帯域となる計算だ。

 2002年といえばそろそろDirect RDRAMの敗色が明らかになりつつある頃ではあったが、設計を開始したと思われる2000年以前の段階ではまだDDR SDRAMがどの程度普及するか見えておらず、DirectRDRAMを使ったのも仕方がないところだ。

 このあたりは、新しい規格にあわせてさっとメモリーをDRDRAMからDDR SDRAMに切り替えられたPCとの相違点ではある。

→次のページヘ続く (超並列の名機Red Stormの2倍以上の性能

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン