動作周波数あたりの性能は
どんな競合製品よりも高い
性能について言えば、180MHz駆動のPA-8000の場合、SPECint95で11.8、SPECfp95で20.2というスコアを出しており、動作周波数あたりの性能で比較すればどんな競合製品よりも高いというのが当時の売り文句であった。
画像の出典は、HotChips VIII(1996年)で同社のAshok Kumarが発表した“The HP PA-8000 RISC CPU”
もっとも絶対性能、という意味では例えば533MHzのAlpha 21164はSPECint95/SPECfp95のスコアが16.6/21.9だったし、Pentium II/450MHzのスコアは同じく17.2/12.9となっており、浮動小数点演算はともかく(DualでMAC演算できるのが強かった)整数演算性能的には相変わらずであった。
そして市場はこのあと、急速に動作周波数競争に入る。つまり高い動作周波数を実現できるプロセスを利用できる会社が勝つ、という様相を呈してきた。
HPも1997年には同じCMOS-14Cを使いながら240MHzまで動作周波数を引き上げたPA-8200、1998年にはインテルの0.25μm CMOSを利用して440MHzまで引き上げたPA-8500、2000年には同じインテルの0.25μm CMOSを使いながら550MHzまで引き上げたPA-8600を投入した。
引き続き、2001年にはIBMの0.18μ SOIプロセスを使って750MHzに引き上げたPA-8700、2004年にはプロセスを同じIBMの0.13μ SOIに切り替えて1GHzを達成したPA-8800、2005年にはそれをさらに1.1GHzまで引き上げたPA-8900をそれぞれリリースした。
実際には動作周波数の向上以外にもキャッシュの容量引き上げやバスの高速化/バスI/Fの変更、さらにPA-8800/8900はデュアルコア化などの性能改善の方策を採るものの、根本的に自社のプロセスは0.5μm CMOSのCMOS-14Cで打ち止めになった。
それ以降は他社のプロセスを使わざるをえないため、結局1世代程度遅れたプロセスで競争することになり、これ以上継続しても競争力がないと判断した。これもあってItaniumに乗り換えたという話は連載121回でした通りだ。
Exemplar SPPの性能はそれなり
COMPAQを買収したことで計画を放逐
プロセッサーの話が終わったところでExemplar SPPに話を戻そう。HPはConvexを買収後、このSPPシリーズである程度はスパコン市場を握れると考えた節がある。
それもあって1995年11月のTOP500を見てみると、SPP 1000/SPP 1200であわせて17サイトほどが導入している。ちなみにSPPシリーズはCD(Compact System)とXA(eXtended Architecture)の2種類があり、CDは最大16プロセッサー、XAは最大128プロセッサーとなる。
おそらくCDはHypernodeが2つまでで1つのシャーシで接続され、XAは複数のシャーシをつなぐ形になっていたのだと思われる。
東京大学の喜連川優教授の研究室の旧ページの中の計算機環境に示されているHP-Convex Exemplarの写真が旧Convexの時代のものと思われる。
Convex由来の最後の製品が、1997年に投入されたSPP 2000である。基本構成は同じだが、クロスバースイッチが5×5から8×8に変更になり、Exemplar SPPの構造図で言うところの縦方向のリンクも8本になった(帯域はそれぞれ1.9GB/秒)。
メモリーコントローラーも8つになっている。CPUは180MHz駆動のPA-8000となり、1つのノード(Hypernode)には最大16個のPA-8000が搭載可能である。
この1ノードの構成がS-Classと呼ばれ、そのS-Classのマシンを複数台つないで最大32ノード・512CPUまで拡張できるようにしたものがX-Classと呼ばれる。
1997年当時のConvexのサイトにいくつか写真があるが、下の画像がそのX-Classのものである。これはS-Classの筐体を2つ縦積みにした構造だ。
画像の出典はInternet Archive
ちなみに1997年当時はもう少し安価に導入できる、D-ClassやK-Classといった製品も用意されたらしい。さら将来の製品ロードマップも示されていた。
画像の出典はInternet Archive
SPP 2000の性能を1997年11月のTOP500の結果を見てみると、最上位なのがNASAジェット推進研究所に納入された128プロセッサー構成のSPP 2000の63位である。理論性能92.16GFLOPSに対して実効性能51.30GFLOPSという効率の低さが気になるが、実はこれには理由がある。
NASAジェット推進研究所はこれとは別に256コアのExepmler X-Classのスコアを登録しているが、こちらのRmaxも51.3GFLOPSになっており、真面目に測定していない可能性が非常に大である。
とはいえ、競合製品と比較してなにかしらアドバンテージがあるか? といわれると非常に難しい程度の性能でしかなかった。
HPはこの後、製品ラインナップの名称をV2xxxシリーズに切り替える。まずPA-8200を搭載したものをV2200/V2250として1997~1998年に発売し、ついで1999年~2000年にはPA-8500/PA-8600を搭載したV2500/V2600を発売するが、Itaniumの発売の遅れもあり、結局ロードマップにあったItaniumベースのVシリーズは出ずじまいであった。
おまけにHPは2001年9月、COMPAQを買収することを決定するため、COMPAQが持っていたスパコン向けのラインナップ、つまりASCI Qと思いっきり被ることになる。
そうした事情もあり、V2500/V2600を最後に、ConvexのExemplarのアーキテクチャーも放逐されることになってしまった。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











