使える超並列マシンとして評価を得た
影の立役者「CRAY T3E」
CRAY T3Eは2年後の1995年にリリースされた。違いはいくつかあり、まずプロセッサーはより高速なAlpha EV56に切り替えられた。連載291回の最後でも少し触れているが、4命令同時発行のスーパースカラー構成で、プロセスは0.35μmのCMOS6を利用している。
動作周波数はいくつかあり、最初にリリースされたT3E-600が300MHz、次いで450MHzのT3E-900、600MHz駆動のT3E-1200とその改良型のT3E-1200E、675MHzのT3E-1350までが最終的に用意された。
いかにプロセスを微細化したとはいえ、ここまで動作周波数をあげるともちろん空冷では追いつかないため、液冷オプションも用意された。トーラス構造も変更され、例えば1024PEの構成ではX/Y/Xはそれぞれ8/16/8ノード構成という、3Dトーラスらしい構成が取れるようになった。
また、T3Dでは2つのプロセッサーで1つのノードを構成していたが、T3Eでは1プロセッサーが1ノード構成になっている。
ハードウェア的に肝となるのはプロセッサーよりもむしろ上の画像に出てくるRouterの部分で、論文によれば375MHzで動作、1本のリンクはおおむね500MB/秒の帯域を持つとしている。
隣接ルーター間の通信はおよそ3クロック(40ナノ秒)、エンドポイント同士、つまり2つの隣あうプロセッサー間は10クロック(133ナノ秒)で通信できるとしており、これはかなり高速な部類に入る。
このT3Eに関しては、ソフトウェア側の開発もだいぶ進んだことで、T3Dの頃に比べて若干性能も改善した。
TOP500の結果をいくつかピックアップしてみると、NASA/ゴダード宇宙飛行センターの1356ノードのシステムは理論性能813.60GFLOPSに対して実効性能525.00GFLOPSで64.5%、米陸軍HPC研究センターの1084ノードのシステムでは1300.80GFLOPSに対して892.00GFLOPSで68.6%と、このあたりはあまり改善されたように見えない。
ところが、もう少し小規模なところでユーリッヒ研究センターの540ノードのシステムは324.00GFLOPS/234.00GFLOPSで効率72.2%、マックス・プランク研究所の812コアのシステムでは487.20GFLOPS/355.00GFLOPSで効率72.9%と、ノード数が増えている割には効率も高まっており、絶対性能そのものの引き上げと相まって、科学技術計算には使えるシステムになったという評価になっている。
例えば1998年にBerkelay Labが出したリリースによれば、もともとインテルのParagon向けに書いたシミュレーションコードをT3Eに移植することで、1024原子の鉄の金属磁性のシミュレーションを最大1.02TFLOPSで実行できた(ノード数は1480)としており、「使える超並列マシン」としての評価がついた。
もっとも絶対的な販売数はそれほど多くなかったため、T3Dの分まで加味して考えると開発費は回収できたにしても、大ヒットしたという状況からは遠かったのは事実だ。
ただここで得た知見、特にT3EのRouter ASICは、RedStormのSeaStar SoCの元になったチップであるし、T3Eで実装されたUNICOS/mk(T3D向けのUNICOS/MAXの発展型)はその後Linuxに移植され、CRAY XTシリーズでも利用されることになった。
その意味では、RedStormの成功やその後のCRAY XT/XCシリーズの基礎がこのT3D/T3Eとも言えるわけで、現在までCRAY Inc.が生き残れることになった影の立役者でもある。その意味では、保険的な発想で開発を始めた当時の経営陣に先見の明があった、ということかもしれない。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











