SV2がCray X1に生まれ変わる
SV1exに続く形でSV2という製品が予定されていたのは、前ページのSV1のロードマップにも掲載されているし、連載279回でも説明した通りだが、このSV2という名前は開発コード名としては残りつつ、製品としてはCray X1という形に生まれ変わることになった。
昔のロードマップのスライドを見ると、SV2という製品はT90やJ90/SV1/SV1eといったベクトルプロセッサー、それとT3Eというアーキテクチャーの両方の後継になっているのがわかる。
もっともこれはSV2だけでなく、旧SGIのOrigin系列にも言える話で、初代のOrigin(Origin 200/2000)とSN1(Origin 300/3000)に続くSN2はやはりT3Eの特徴を引き継いだものになる予定であり、実際同社はこれをItaniumベースのSN-IPFという形でやはり2002年に発表した。
要するに元のロードマップは、CrayのベクトルプロセッサーとSGIのMIPSベースプロセッサーの系列に、CrayのT3D/T3Eのアーキテクチャーを融合させよう、という発想であり、これはCrayのSGIからのスピンアウト後も変わらずに進むことになった。このあたりを端的に示したのが下図である。
Cray X1の内部構造であるが、プロセッサーそのものはSV1の延長にある。異なるのは、4つのベクトルプロセッサーで2MBのキャッシュを共有するように改められたことだ。
コアの動作周波数は800MHzまで引き上げられ、1つのベクトルプロセッサーで3.2GFLOPS、これを4コア搭載するMSPモジュールでは12.8GFLOPSに達する。ちなみに各々のSSP(Single Stream Processor)の中の“S”(Scalar Unit)は400MHz動作で、“V”(Vector Unit)が800MHzになっている。
このMSPを4つ搭載した16CPUの構成(Crayの用語ではNode Module)が最小構成とされる。
ちなみに、いかにCMOSを使って微細化したとはいえ800MHzのコア×4を内蔵したMCM(Multi-Chip Module)をさらに4つ搭載するので、空冷では間に合わない。そこでCray X1ではCRAY-2以来となるフロリナートを利用した液冷が採用された。
といってもCRAY-2なみに回路全体をフロリナートに漬けるのではなく、MCM部と接する厚いアルミの放熱板の中にフロリナートを通す構造になっているようで、メモリーあるいはネットワークチップは空冷のままとなっている。
ちなみにこのX1ではメモリーとしてDirect RDRAMが採用された。1ノード、つまり上の画像に示される1枚のボード上には32ch/64スロットのRIMMスロットが用意されており、PC800を利用した場合でボード1枚あたり51.2GB/秒の帯域となる計算だ。
2002年といえばそろそろDirect RDRAMの敗色が明らかになりつつある頃ではあったが、設計を開始したと思われる2000年以前の段階ではまだDDR SDRAMがどの程度普及するか見えておらず、DirectRDRAMを使ったのも仕方がないところだ。
このあたりは、新しい規格にあわせてさっとメモリーをDRDRAMからDDR SDRAMに切り替えられたPCとの相違点ではある。
→次のページヘ続く (超並列の名機Red Stormの2倍以上の性能)
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第876回
PC
このままではメモリーが燃える! HBM4/5世代に向けた電力供給の限界と、Samsungが示すパッケージ協調設計の解 -
第875回
PC
1000A超のAIプロセッサーをどう動かすか? Googleが実践する垂直給電(VPD)の最前線 -
第874回
PC
AIの未来は「電力」で決まる? 巨大GPUを支える裏面給電とパッケージ革命 -
第873回
PC
「銅配線はまだ重要か? 答えはYesだ」 NVIDIA CEOジェンスンが語った2028年ロードマップとNVLink 8の衝撃 -
第872回
PC
NVIDIAのRubin UltraとKyber Rackの深層 プロトタイプから露見した設計刷新とNVLinkの物理的限界 -
第871回
PC
GTC 2026激震! 突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰 -
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 -
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 - この連載の一覧へ











