CPUの内部構造に手が入った
「CRAY C90」
さて話を戻そう。CRAY Y-MP Model Dの後継製品が、CRAY Y-MP C90、のちにCRAY C90と呼ばれるようになったシリーズである。
下の画像はC90シリーズのプロセッサー構造である。よく見ると、メモリーの右半分はCPU 0の内部構造のはずなのに、メモリーの左にもCPU 0が並んでいるのがおもしろいが、これは誤植で実際は左側はCPU 1~15と理解してほしい。
C90は、最大16プロセッサーまでをサポートし、サイクル時間はさらに短縮されて4.1ns(244MHz)に達したのだが、それよりも大きな違いはCPUの内部構造に手が入ったことだ。
X-MPの内部構造と比較してもらうとわかるのだが、ベクトル長さが従来の倍の128bitになった。つまり1サイクルあたり2つの浮動小数点演算が可能になっている。もちろんCRAY-1から採用されたChainingは引き続き利用できるので、実質1サイクルあたり4つの浮動小数点演算が可能になるわけだ。
これによりピーク性能はプロセッサー1つあたり975.6MFLOPSほど。16プロセッサー構成ではピークで15.6GFLOPSに達した。これはCRAY-3の15.17GFLOPSとほぼ同等であり、そして実際にCRAY-3に代わってさまざまな契約を取ることに成功した。
ちなみにC90はベクトルの幅を増やしているので、その性能をフルに生かすためには再コンパイル・再プログラミングが必要になるが、128bitのベクトルレジスターの半分を使わないままでよければ、Y-MPのバイナリーがそのまま動作したので、比較的移行もスムーズであったそうだ。
このC90シリーズだが、ラインナップとして全部で22モデルほどが用意されていた。
CRAY C90シリーズのラインナップ | ||
---|---|---|
モデル名称 | プロセッサー数 | メモリー量 |
C92A | 1~2 | 64~128MWords(512MB~1GB) |
C94A | 2 | 128MWords(1GB) |
C94 | 2~4 | 128~256MWords(1~2GB) |
C98 | 4~8 | 256~512MWords(2~4GB) |
C916 | 8~16 | 128~1024MWords(1~8GB) |
このうちC92A/C94Aは他と比べて一回り筐体サイズが小さいエントリー向けといった感じだ。いずれのモデルも冷却方法は空冷であるが、さすがに動作周波数が200MHzを超えるとECLベースなので発熱はすごい。
これを強制的に空冷するわけで、そのための専用熱交換器(HEU:Heat Exchanger Unit)も提供されるわけだが、ハイエンドのC916シリーズともなると熱交換機がダブル搭載というすごいことになっていた。
このC90シリーズにも、後追いの形でECL SRAMに代わってDRAMを搭載するモデルが追加され、こちらはD92/D92A/D94/D98という型番で販売された。さすがにハイエンドのC916にはこのモデルはなかったらしい。ただその分最大で2MWords(16GB)のモデルも用意された。
この製品の後継が、CRAY T90シリーズである。こちらは1995年に出荷された製品で、サイクル時間は2.2ナノ秒(450MHz)にまで短縮、プロセッサー数は32にまで増えた。プロセッサーの内部構成はCRAY C90と同じで、完全にバイナリー互換とされている。
モデルは8/16/32の3つがあることは確実で、他に4プロセッサーモデルもあった「らしい」のだが、入手したカタログにはその記載がない。32プロセッサーモデルでのピーク性能は58.2GFLOPSで、そろそろ60GFLOPSに達しようというあたり。CRAY-3やC90の4倍近い。
実は、ネイティブ(という表現が適切かどうかはわからないが)なデュアルベクトルマシンはこのT90で打ち止めとなっている。
これらとは別の製品ラインも存在した。前回の最後で、低価格向けにCRAY X-MP EA/seというモデルがあったことを紹介した。この後継製品として、CRIはCRAY Y-MP ELというシリーズを1992年に発表した。
こちらはアーキテクチャーこそY-ELと互換ながら、内部構造はCMOSベースであった。もっと言えば、このELはCRIが開発したものではなく、Supertek Comutersという会社が開発したものである。同社は1985年に設立されたCRAYクローン製造ベンダーで、最初のSupertek S-1はCRAY X-MP互換のものだった。
これに続き、S-2というCRAY Y-MP互換の製品を作り上げるが、Supertek ComputersそのものをCRIが買収、自社のラインナップに加える。Supertek S-1はCRAY XMSとして1990年から販売され、Supertek S-2がCRAY Y-MP ELとなったわけだ。
もっとも互換とは言っても、内部バスはVMEで、CPUの数は1(EL92)/2(EL94)/4(EL98)だけだった。サイクル時間も30ナノ秒(33.3MHz)なので、性能的にはまったく比較にならないが、その分価格も運用コストも桁違いに安かっため、たとえばプログラムの開発用にはこれで十分だったようだ。
UCAR(University Corporation for Atmospheric Research)のSCD(Scientific Computing Division)は1994~1997年にかけてこのCRAY Y-MP EL92×1とEL98×2を運用していたが、プログラムの開発と大量のメモリーを喰う処理の実行には最適だったとしている。
→次のページヘ続く (ベクトル型の代表作CRAYの後継機)
この連載の記事
-
第776回
PC
COMPUTEXで判明したZen 5以降のプロセッサー戦略 AMD CPU/GPUロードマップ -
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ - この連載の一覧へ