ジョブの要求比率に応じて
3研究所間の使用比率を動的に変更可能
そしてRed Stormでは、初めての試みとして“Capability Computing”なる概念が導入された。日本語では「計算能力によるコンピューティング」という訳語があてられているが、要するに非常に計算量が多い大規模シミュレーションなどを、最大限の計算能力を利用して最小時間で解決するという仕組みである。
Red Stormでは当初、「各プロセッサーの処理時間の80%を、システム負荷の40%以上を占める作業に割り当てる」というポリシーでCapability Computingに向けた実施を行なっている。
またRed Strormは最初のTri-Lab Platformとされる。これはなにかというと、これまで3つの国立研究所(サンディア、ロスアラモス、ローレンス・リバモア)はそれぞれ独自にマシンを設置して、基本的にはそれぞれが独自に運用していたが、この際の計算能力の比率は2:1:1にする、という決まりがあった。
つまり自分の研究所での利用比率を50%にして、他の研究所がそれぞれ25%づつを利用できるという運用ポリシーだ。
ところが従来のASCIシステムの場合、物理的にノード数を2:1:1にパーティション分割する、という形でしか実現できず、これはCapability Computingには相応しい運用形態ではない。そこでRed Stormではこの比率を動的に変化させられるようになっている。
5倍もの性能向上を成し遂げ
傑作機となったRed Storm
いろいろと新機軸を盛り込んだASC Red Stormだが2004年7月にインストールを完了し、2005年11月のTOP 500では36.2TFLOPSで6位につける。
理論性能43.5TFLOPSに対して実効性能36.2TFLOPSで効率は83.2%に達しており、これはそう悪い数字ではない。
これに続き、(当初は2005年末としていたが、やや遅れて)2006年11月に、プロセッサーを2.4GHzのデュアルコアOpteronにアップグレードし、理論性能で127.4TFLOPS、実効性能でも101.4TFLOPSを叩き出して2006年11月のTOP 500で2位に躍り出る。
おそらくこの頃にはCatamountがSMP対応になり、デュアルコアOpteronでも利用できるようになったのだろう。SMP対応になったために若干メモリーアクセスのレイテンシーが増えたためか、効率は79.6%とやや落ちたが、絶対性能で言えば約2.8倍になったのは、プロセッサーの更新に加えてコンピュートノードの追加もあったためだ。
さらに2年後の2008年2月には、プロセッサーを一部2.2GHzのクワッドコアOpteron(悪名高いBarcelonaコアである)に置き換えることで理論性能を284TFLOPSに引き上げるとともに、ノードあたりのメモリーを8GB(コアあたり2GB)まで増加させるが、実効性能は204.2TFLOPSとだいぶ効率を下げており(71.9%)、2008年11月のTOP500でも10位に入るのがやっとであった。
そんなわけで最後の方ではあまり性能改善にはつながらなかったものの、40TFLOPSから200TFLOPSまで5倍もの性能向上を成し遂げ、また(最後のクワッドコアを除けば)高効率を保って利用可能であり、これはサンディア国立研究所やASC(Advanced Simulation and Computing Program:アメリカ合衆国連邦政府のスーパーコンピュータ計画)のみならず、CRAYにとっても大当たりのシステムとなった。
実際CRAYはこのRed Stormの構成をCRAY XT3として製品ラインナップに加え、CSCS(Swiss National Supercomputing Centre)、オークリッジ国立研究所、ERDC(US Army Engineer Research and Development Center)、北陸先端科学技術大学院大学などから早いタイミングで受注しており、商業的にも成功した部類に入る。
またクワッドコアOpteronを搭載したモデルはCRAY XT4としてこれも販売され、特にプロセッサーコアを65nmプロセスのBarcelonaから45nmプロセスのShanghaiに切り替えた後は、性能/消費電力もだいぶ改善されたので、こちらも相応に売れたモデルとなった。
この後継としてさらにCRAY XT5という製品も投入され、これを利用してオークリッジ国立研究所に納入されたJaguarは2009年11月から2010年6月でTOP500の1位を占めるなど、Red Stormのアーキテクチャーはその後も長く利用されることになった。
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ