このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第279回

スーパーコンピューターの系譜 CRAY Y-MP以降のベクトル型マシン

2014年11月17日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

CPUの内部構造に手が入った
「CRAY C90」

 さて話を戻そう。CRAY Y-MP Model Dの後継製品が、CRAY Y-MP C90、のちにCRAY C90と呼ばれるようになったシリーズである。

CRAY C916のカタログ(MCPB-104-1191)の表紙より抜粋。正確な高さはわからないが、別の写真では脇に立つ男性より頭2つ分以上高いので、2m以上と思われる

 下の画像はC90シリーズのプロセッサー構造である。よく見ると、メモリーの右半分はCPU 0の内部構造のはずなのに、メモリーの左にもCPU 0が並んでいるのがおもしろいが、これは誤植で実際は左側はCPU 1~15と理解してほしい。

C90シリーズのプロセッサー構造。CRAY C90 Series Functional Description Manual(HR-04028-0A)から抜粋

 C90は、最大16プロセッサーまでをサポートし、サイクル時間はさらに短縮されて4.1ns(244MHz)に達したのだが、それよりも大きな違いはCPUの内部構造に手が入ったことだ。

 X-MPの内部構造と比較してもらうとわかるのだが、ベクトル長さが従来の倍の128bitになった。つまり1サイクルあたり2つの浮動小数点演算が可能になっている。もちろんCRAY-1から採用されたChainingは引き続き利用できるので、実質1サイクルあたり4つの浮動小数点演算が可能になるわけだ。

 これによりピーク性能はプロセッサー1つあたり975.6MFLOPSほど。16プロセッサー構成ではピークで15.6GFLOPSに達した。これはCRAY-3の15.17GFLOPSとほぼ同等であり、そして実際にCRAY-3に代わってさまざまな契約を取ることに成功した。

 ちなみにC90はベクトルの幅を増やしているので、その性能をフルに生かすためには再コンパイル・再プログラミングが必要になるが、128bitのベクトルレジスターの半分を使わないままでよければ、Y-MPのバイナリーがそのまま動作したので、比較的移行もスムーズであったそうだ。

 このC90シリーズだが、ラインナップとして全部で22モデルほどが用意されていた。

CRAY C90シリーズのラインナップ
モデル名称 プロセッサー数 メモリー量
C92A 1~2 64~128MWords(512MB~1GB)
C94A 2 128MWords(1GB)
C94 2~4 128~256MWords(1~2GB)
C98 4~8 256~512MWords(2~4GB)
C916 8~16 128~1024MWords(1~8GB)

 このうちC92A/C94Aは他と比べて一回り筐体サイズが小さいエントリー向けといった感じだ。いずれのモデルも冷却方法は空冷であるが、さすがに動作周波数が200MHzを超えるとECLベースなので発熱はすごい。

 これを強制的に空冷するわけで、そのための専用熱交換器(HEU:Heat Exchanger Unit)も提供されるわけだが、ハイエンドのC916シリーズともなると熱交換機がダブル搭載というすごいことになっていた。

C916シリーズと熱交換器(HEU)。ちなみにHEU-C90の外にRCU(Refrigeration Control Unit)というものがあり、これはマシンルームの外の冷却水などと接続される。HEUはCPUに供給する空気を冷却する一次冷却なわけだが、RCUはHEUを冷却する二次冷却のために利用される

 このC90シリーズにも、後追いの形でECL SRAMに代わってDRAMを搭載するモデルが追加され、こちらはD92/D92A/D94/D98という型番で販売された。さすがにハイエンドのC916にはこのモデルはなかったらしい。ただその分最大で2MWords(16GB)のモデルも用意された。

 この製品の後継が、CRAY T90シリーズである。こちらは1995年に出荷された製品で、サイクル時間は2.2ナノ秒(450MHz)にまで短縮、プロセッサー数は32にまで増えた。プロセッサーの内部構成はCRAY C90と同じで、完全にバイナリー互換とされている。

CRAY T90(出典:craysupercomputers.com)

 モデルは8/16/32の3つがあることは確実で、他に4プロセッサーモデルもあった「らしい」のだが、入手したカタログにはその記載がない。32プロセッサーモデルでのピーク性能は58.2GFLOPSで、そろそろ60GFLOPSに達しようというあたり。CRAY-3やC90の4倍近い。

 実は、ネイティブ(という表現が適切かどうかはわからないが)なデュアルベクトルマシンはこのT90で打ち止めとなっている。

 これらとは別の製品ラインも存在した。前回の最後で、低価格向けにCRAY X-MP EA/seというモデルがあったことを紹介した。この後継製品として、CRIはCRAY Y-MP ELというシリーズを1992年に発表した。

 こちらはアーキテクチャーこそY-ELと互換ながら、内部構造はCMOSベースであった。もっと言えば、このELはCRIが開発したものではなく、Supertek Comutersという会社が開発したものである。同社は1985年に設立されたCRAYクローン製造ベンダーで、最初のSupertek S-1はCRAY X-MP互換のものだった。

 これに続き、S-2というCRAY Y-MP互換の製品を作り上げるが、Supertek ComputersそのものをCRIが買収、自社のラインナップに加える。Supertek S-1はCRAY XMSとして1990年から販売され、Supertek S-2がCRAY Y-MP ELとなったわけだ。

 もっとも互換とは言っても、内部バスはVMEで、CPUの数は1(EL92)/2(EL94)/4(EL98)だけだった。サイクル時間も30ナノ秒(33.3MHz)なので、性能的にはまったく比較にならないが、その分価格も運用コストも桁違いに安かっため、たとえばプログラムの開発用にはこれで十分だったようだ。

 UCAR(University Corporation for Atmospheric Research)のSCD(Scientific Computing Division)は1994~1997年にかけてこのCRAY Y-MP EL92×1とEL98×2を運用していたが、プログラムの開発と大量のメモリーを喰う処理の実行には最適だったとしている。

→次のページヘ続く (ベクトル型の代表作CRAYの後継機

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

最新記事

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン