CRAY Y-MPの2倍以上の性能を記録した
後継機「CM-2」
高額すぎて売れる見込みがなかったCM-1を、もう少し汎用的な用途に使えるようにしよう、というアイディアが出てくる。これに沿って1987年に製品化されたのが、CM-2である。
CM-1とCM-2のアーキテクチャー面での最大の違いは、浮動小数点演算能力の強化である。CM-1の整数演算はとても高速だが、浮動小数点演算を同じようにやると、ガクンと性能が落ちた。
そこでこれを補うために、ハードウェアで浮動小数点演算を実装することになった。実際には、2チップというか32nodeに1つの割合、つまりシステム全体では2048個のWeitek WTL3132 FPUが搭載された。
WTL3132は汎用の32bit浮動小数点プロセッサーで、サイクル時間100ナノ秒のWTL3132-100が20MFLOPS、120ナノ秒のWTL3132-120が16MFLOPSの性能とされた。
100ナノ秒、つまり10MHz動作なら普通は10MFLOPSだが、WTL3132はMAC演算(掛け算+加算)を1サイクルで実行できるので、2倍の20MFLOPSになる。
ちなみに資料がないのだが、浮動小数点演算性能として示されているものから逆算すると、搭載されていたのはWTL3132-120だったようだ。またメモリーもnodeあたり4Kbitから8Kbit(32node合わせて256Kbit)に倍増されている。またECCも追加されている。
なお、上の画像でNEWS Gridとあるのは、North/East/West/Southから取られたものだ。本来CM-2は立方体構成のグリッドとして物理的には接続されるが、これを仮想的に2次元グリッドにマッピングしたものがNEWS Gridと考えればいい。
ちなみに、CM-2と同時に提供されたものにData VaultというRAIDアレイがある。42台のHDD(うち3台がスペア)をストライピングで動かし、100MB/秒以上の転送速度と最大480GBもの容量を実現するものだった。
CM-2は、サイクル時間が142ナノ秒(約7MHz)で、CM-1よりはかなり高速なものの、当時としてはそう高速な部類ではない。しかし、その性能は凄まじく、6万5536node構成のCM-2は理論上のピーク性能で28GFLOPS、実際の性能でも5.2GFLOPSあまりの性能を記録している。
1987年といえばまだCRAY Y-MPが完成する前だが、翌1988年に登場したCRAY Y-MPが8プロセッサー構成で実効2.1GFLOPSだったことを考えれば、CM-2の数字はかなり素晴らしい。
CM-2は最大構成こそ64Knodeであるが、16K/32Knodeの構成も可能だった。このCM-2の低価格版として4K/8Knodeの構成のCM-2aも後追いで追加される。
また、正確な登場時期が不明だが、おそらく1980年代後半にはサイクル時間を100ナノ秒(10MHz)に引き上げたCM-200もリリースされる。こちらは64Knodeの構成で、実効性能9.8GFLOPSを記録している。
Thinking Machines社はCM-2を発表した後あたりから絶頂期に入る。1989年の同社の売り上げは4500万ドルで、利益は70万ドルほどとされた。この時期は、さまざまな政府組織が高性能なコンピューターを調達しようとしていた時期だった。
やや時期が後になるが、NSF(National Science Foundation:アメリカ国立科学財団)のHPCC(High Performance Computing and Communication)プログラムは、実際には12もの政府組織が参加しており、Thinking Machinesに肩入れしていたDAPRAもこれに加わっていた。というよりプログラムをかなりリードしていた。
HPCCは1996年までに1TFLOPSのマシンを構築しようというもので、Thinking Machinesもこれに応募すべくCM-5を構築する。次回はこの話をしよう。
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ