謎に包まれる動作周波数
227MHzで動作したらしいが……
MTA-2は、動作周波数がどの程度かははっきりしない。米国海軍研究試験所が2003年に発表した“Early Experience with Scientific Programs on the Cray MTA-2”という論文(関連リンク)によれば、米国海軍研究試験所には200MHz駆動のプロセッサーを40個搭載し、160GBのRAMを積んだマシンが納入されたとしている。
一方、 Aad J. van der Steen氏とJack J. Dongarra氏が書いた文章“Overview of Recent Supercomputers”(関連リンク)には、米国海軍研究試験所には28プロセッサーのシステムが納入され、これとは別にMTA-1を導入したサンディエゴ・スーパーコンピューター・センターに16プロセッサーのシステムが入ったという記述がある(関連リンク)。
この中では当初サイクルタイムが3ナノ秒(333MHz駆動)を予定していたものの、実際には4.4ナノ秒(227MHz)に落ち着いたとされている。
ただこの文章はやや真偽が怪しい。まず前半に関して言えば、例えばこんなニュースもあり、一時期は28プロセッサー構成での契約が実在した模様だ。
ただこの時はシステム全体の契約はLogicon Inc.が取りまとめていたはずなのに、最終的にはNorthrop Grumman Information Technologyが取りまとめを行なって納入しているあたり、どこかでいろいろ契約が変わったらしく、その際にプロセッサー構成も変更になったのだろう。最終的には40プロセッサー構成となっている。
一方後半だが、NPACI(National Partnership for Advanced Computational Infrastructure)とサンディエゴ・スーパーコンピューター・センターは2001年9月14日にMTA-1のリタイアを発表(関連リンク)しており、これに続いてMTA-2を導入したという記述がないので、おそらくはなんらかの勘違いであろうと思われる。
ちなみにMTA-1リタイアの理由としては、プログラミングモデルこそ魅力的で、かつ性能も出しやすいが、製造とメンテナンスが困難であり、そのうえ動作が不安定なため動作周波数を落とさざるを得ず、結果として利用者の計算待ち時間がどんどん増えるという状況に陥ったためだとしている。
前回の記事では1998年12月に4P構成を取ったと解説したが、1999年6月末にはこれをさらに4つ増やして8P構成にはできたらしい。
ただここからさらに16P構成にすることを目論んだものの、製造が非常に困難(理屈で言えば2001年まで待てば16Pにできる計算になるが)で、もう見切りをつけたということだろう。
リリースの最後は“Development of a follow-on MTA-2 based on CMOS technology continues at Cray Inc. This computer should be much easier to manufacture and scale to larger sizes. Time will tell whether this is sufficient to revive user interest.”という文章で締められている。
「MTA-2になれば期待できる『かもね』」と結んでいるあたりは多分にリップサービスというよりは毒がある気がするのだが、とにかくサンディエゴ・スーパーコンピューター・センターはこれでMTAアーキテクチャーの利用をあきらめている。
以上のことから、333MHzを予定しつつ227MHz駆動に終わった、という話が本当にMTA-2の数字なのかかなり怪しいのが実情であり、現時点で確たる数字は米国海軍研究試験所の論文にある200MHzのみである。
性能は見劣りするものの
MTA-2を2ヵ所に納入
話をMTA-2に戻そう。2002年1月にCrayはMTA-2が2ヵ所に販売契約を結んだことを明らかにした(関連リンク)。契約規模が大きかったのは米国海軍研究試験所の方で、2002年10月に納入が完了している(関連リンク)。
ただし1号機は、実は日本の電子航法研究所に納入されている。もともとは運輸省の一部門だったのが国土交通省の研究所となり、今は国立研究開発法人になっているが、要するに航空交通にまつわるさまざまな問題を解決するための研究機関である。
ここでMTA-2をどう利用していたかの実例として、ボイスレコーダーに記録された音声からCEM(Cerebral Exponent Macro)値というパラメーターを算出するための演算に要する時間が、MTA-2を利用することで5桁高速化されたという論文「発話音声による心身状態評価技術の現状と展望」 (関連リンク)があったりするので、かなりいろいろ実用的に使われていたようである。
ただ絶対性能という点では見劣りしていたことは間違いない。前述の通りプロセッサーの動作周波数は200MHzと見積もられ、ということは1プロセッサーあたり600MFLOPSでしかなく、米国海軍研究試験所に納入された40プロセッサー構成ですら合計で24GFLOPSということになる。
MTA-1に比べればだいぶ高速化に成功したものの、例えばCRIが1991年に出した">CRAY C90ですら15.6GFLOPSを出していたことを考えると、絶対性能という点ではかなり見劣りすることになる。
そんなこともあってか、結局のところMTA-2が販売されたのはこの2ヵ所のみで、売り上げもは米国海軍研究試験所向けのものはそれなりだったらしい(電子航法研究所は金額非公開となっている)が、そこで終わりだから開発費を考えると「成功した」とは言いがたい。
ところがBurton Smith氏はまだ諦めなかったらしい。MTA-2に続き、MTA-3とMTA-4が予定されていた。MTA-3は基本的にはMTA-2と同じながら、インターコネクト・ネットワークを遅い(ただし低価格)なものに切り替えることでシステムコストを抑えたモデルだ。
MTA-4はMTA-3にデータキャッシュを追加したり、ネットワークをやや高速化して、性能改善を図ったモデルになる予定であった。
→次のページヘ続く (CRAY XMTとして発売されたMTA-3)
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ