POWER2/P2SCとPowerPC 604の
2つのベースが存在
POWER2/P2SCベースのRS/6000とPowerPC 604ベースのRS/6000の最大の違いは、プロセッサー数である。POWER2/P2SCベースは前述の通りマルチプロセッサーに未対応なので、マシン1台あたり1CPUという構成である。
ところがPowerPCは当初からマルチプロセッサーに対応しており、RS/6000の中にも複数プロセッサーを搭載したモデルがラインナップされている。
PowerPC 604世代の場合、タワー型のType 7012 Model G40は最大4プロセッサー、ラックマウント型のType 7015 Model R4xは最大8プロセッサーが利用可能になっている。この結果、プロセッサー単体の性能は以下のようになる。
プロセッサ単体の性能(出典:SPEC CPU95 Result) | |||
---|---|---|---|
System | Processor | SPECint_base95 | SPECfp_base95 |
RS/6000 591 | POWER2(77MHz) | 3.19 | 11.2 |
RS/6000 595 | P2SC(135MHz) | 5.88 | 15.4 |
RS/6000 C20 | PowerPC 604(120MHz) | 3.47 | 3.50 |
整数演算性能はともかく浮動小数点演算性能ではPowerPCは大きく見劣りするが、プロセッサ数が増えればその分上乗せも大きくなる。
また、当初のPowerPC 604は133MHzあたりまでが普及帯だった(*)が、1996年にはプロセスを0.50μmから0.35μmに微細化するとともに、命令/データでキャッシュを分割したPowerPC 604eを投入、動作周波数は233MHzに達した。
*:スペック上は180MHzまで用意されていたが、ほとんど出荷されなかった。
さらにIBMはこの後、0.20μmプロセスに微細化し、最大400MHz駆動となるPowerPC 604evをリリースし、どちらもRS/6000に採用される。こちらでは急速に性能を上げており、例えば1997年に投入されたRS/6000 43P-140(PowerPC 640ev 332MHz)の場合、1PでのSPECint_base95で12.9、SPECfp_base95で5.99まで改善している。
PowerPC 604ベースのSP2では、このPowerPC 604ev 332MHzを2/4P構成とした製品が用意されており、トータル性能ではPOWER2やP2SCを上回ることになった。
アップグレードで性能が飛躍的に向上
これで、ようやく連載288回で話をしたASCI Blueの提案依頼書のタイミングになった。この時点ではまだP2SCは完成しておらず、またPowerPC 604ベースのSP2は存在しない。なので実在するシステムはPOWER2ベースのSP2しかないのだが、IBMはP2SPやPowerPC 604の完成を前提に、最終的にはPowerPC 640evベースのSP2を提案した。
この提案に沿って、まず1996年9月20日には、最初のシステム(ID:Initial Delivery)がローレンス・リバモア国立研究所に納入されている。これは契約締結からからわずか6週間のことで、その2週間後には稼動を開始している。
もっとも時期を考えると、これは112MHz駆動のPowerPC 604ベースのHigh 1というモデルと思われ、しかも1ノードあたり1プロセッサーの構成だった。
IDの構成は512ノードでピーク性能は136GFLOPS、メモリーは67GB、ストレージは2.5TBで、キャビネットは340とされており、340キャビネットの半分弱がプロセッサー、残りがストレージとネットワークと思われる。
ちなみにこのIDは非公式にはASCI Blue Snowと呼ばれていたらしい。このシステムは1998年3月にアップグレードが行なわれ、112MHz駆動のPowerPC 604×1のカードが、334MHz駆動のPowerPC 604ev×4のカードに交換されている。
ただこの時には単にカード交換だけではなく、ノードの追加とおそらくネットワークの追加もなされていると思われる。
1998年10月にASCI Blue Pacific CTR(Combined Technology Refresh)として構成されたシステムは、1344個(336ノード)のPowerPC 604ev 332MHzから構成され、LINPACKで468.2GFLOPSを叩き出して1998年11月のTOP500では8位に入っている。
CTRとは別に、最終的にASCI Blueで求められた3TFLOPSマシンは、1999年に稼動を始めたASCI Blue Pacific SST(Sustained Stewardship TeraOp、非公式名称はASCI Blue Sky)で、こちらは5856個(1464ノード)のPowerPC 604ev 332MHzから構成される。
この膨大な数のノードは、TB3MXと呼ばれる双方向の150MB/秒のリンクで接続されており、これは続くASCI Whiteでも継承されることになる。
ちなみにASCI Blue Pacific SSTの設置面積は1万2000平方フィート、消費電力は5.65MWという壮絶なものである。理論ピーク性能は3.86TFLOPSだが、LINPACKでは2.14TFLOPSを計測。1999年11月~2000年6月のTOP500では2位の座を維持した。
このASCI Blue Pacific SSTを(ASCI Redの時と同じように)10TFLOPSにアップグレードするという話も出ていたが、それは最終的にASCI Whiteとして実現することになった。その理由は比較的明確である。1999年11月におけるTOP500の結果を抜き出してみよう。
1999年11月におけるTOP500の結果 | ||||
---|---|---|---|---|
CPU数 | LINPACK (GFLOPS) |
理論値 (GFLOPS) |
効率 (%) |
|
ASCI Red | 9632 | 2379 | 3207 | 74.2 |
ASCI Blue Pacific SST | 5808 | 2144 | 3856.5 | 55.6 |
ASCI Blue Mountain | 6144 | 1608 | 3072 | 52.3 |
ご覧のとおり、MPP(Massively Parallel Processing:超並列コンピューター)のASCI Redの効率の良さが明白だが、それを抜きにすると、同じSMP(Symmetric Multiprocessing:対称型マルチプロセッシング)+クラスターであればASCI Blue MountainよりもBlue Pacific SSTの方が少ないコア数で実効性能も高い。
おまけに1999年といえば、もう次のPOWER3チップがリリースされ、POWER4チップの設計も始まっていたから、プロセッサーコアをこれに代えるだけで性能が向上することが期待できた。
他方ASCI Blue Mountainの方は、1998年にMIPS部門を再度切り離しており、プロセッサー単体のさらなる向上があまり期待できなかったため、これをアップグレードする案は望み薄だった。
したがって、ASCI Blue PacificはそのままスムーズにASCI Whiteに移行した反面、ASCI Blue MountainはASCI Qに期待をかけることになる。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ