使える超並列マシンとして評価を得た
影の立役者「CRAY T3E」
CRAY T3Eは2年後の1995年にリリースされた。違いはいくつかあり、まずプロセッサーはより高速なAlpha EV56に切り替えられた。連載291回の最後でも少し触れているが、4命令同時発行のスーパースカラー構成で、プロセスは0.35μmのCMOS6を利用している。
動作周波数はいくつかあり、最初にリリースされたT3E-600が300MHz、次いで450MHzのT3E-900、600MHz駆動のT3E-1200とその改良型のT3E-1200E、675MHzのT3E-1350までが最終的に用意された。
いかにプロセスを微細化したとはいえ、ここまで動作周波数をあげるともちろん空冷では追いつかないため、液冷オプションも用意された。トーラス構造も変更され、例えば1024PEの構成ではX/Y/Xはそれぞれ8/16/8ノード構成という、3Dトーラスらしい構成が取れるようになった。
また、T3Dでは2つのプロセッサーで1つのノードを構成していたが、T3Eでは1プロセッサーが1ノード構成になっている。
ハードウェア的に肝となるのはプロセッサーよりもむしろ上の画像に出てくるRouterの部分で、論文によれば375MHzで動作、1本のリンクはおおむね500MB/秒の帯域を持つとしている。
隣接ルーター間の通信はおよそ3クロック(40ナノ秒)、エンドポイント同士、つまり2つの隣あうプロセッサー間は10クロック(133ナノ秒)で通信できるとしており、これはかなり高速な部類に入る。
このT3Eに関しては、ソフトウェア側の開発もだいぶ進んだことで、T3Dの頃に比べて若干性能も改善した。
TOP500の結果をいくつかピックアップしてみると、NASA/ゴダード宇宙飛行センターの1356ノードのシステムは理論性能813.60GFLOPSに対して実効性能525.00GFLOPSで64.5%、米陸軍HPC研究センターの1084ノードのシステムでは1300.80GFLOPSに対して892.00GFLOPSで68.6%と、このあたりはあまり改善されたように見えない。
ところが、もう少し小規模なところでユーリッヒ研究センターの540ノードのシステムは324.00GFLOPS/234.00GFLOPSで効率72.2%、マックス・プランク研究所の812コアのシステムでは487.20GFLOPS/355.00GFLOPSで効率72.9%と、ノード数が増えている割には効率も高まっており、絶対性能そのものの引き上げと相まって、科学技術計算には使えるシステムになったという評価になっている。
例えば1998年にBerkelay Labが出したリリースによれば、もともとインテルのParagon向けに書いたシミュレーションコードをT3Eに移植することで、1024原子の鉄の金属磁性のシミュレーションを最大1.02TFLOPSで実行できた(ノード数は1480)としており、「使える超並列マシン」としての評価がついた。
もっとも絶対的な販売数はそれほど多くなかったため、T3Dの分まで加味して考えると開発費は回収できたにしても、大ヒットしたという状況からは遠かったのは事実だ。
ただここで得た知見、特にT3EのRouter ASICは、RedStormのSeaStar SoCの元になったチップであるし、T3Eで実装されたUNICOS/mk(T3D向けのUNICOS/MAXの発展型)はその後Linuxに移植され、CRAY XTシリーズでも利用されることになった。
その意味では、RedStormの成功やその後のCRAY XT/XCシリーズの基礎がこのT3D/T3Eとも言えるわけで、現在までCRAY Inc.が生き残れることになった影の立役者でもある。その意味では、保険的な発想で開発を始めた当時の経営陣に先見の明があった、ということかもしれない。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ