動作周波数あたりの性能は
どんな競合製品よりも高い
性能について言えば、180MHz駆動のPA-8000の場合、SPECint95で11.8、SPECfp95で20.2というスコアを出しており、動作周波数あたりの性能で比較すればどんな競合製品よりも高いというのが当時の売り文句であった。
画像の出典は、HotChips VIII(1996年)で同社のAshok Kumarが発表した“The HP PA-8000 RISC CPU”
もっとも絶対性能、という意味では例えば533MHzのAlpha 21164はSPECint95/SPECfp95のスコアが16.6/21.9だったし、Pentium II/450MHzのスコアは同じく17.2/12.9となっており、浮動小数点演算はともかく(DualでMAC演算できるのが強かった)整数演算性能的には相変わらずであった。
そして市場はこのあと、急速に動作周波数競争に入る。つまり高い動作周波数を実現できるプロセスを利用できる会社が勝つ、という様相を呈してきた。
HPも1997年には同じCMOS-14Cを使いながら240MHzまで動作周波数を引き上げたPA-8200、1998年にはインテルの0.25μm CMOSを利用して440MHzまで引き上げたPA-8500、2000年には同じインテルの0.25μm CMOSを使いながら550MHzまで引き上げたPA-8600を投入した。
引き続き、2001年にはIBMの0.18μ SOIプロセスを使って750MHzに引き上げたPA-8700、2004年にはプロセスを同じIBMの0.13μ SOIに切り替えて1GHzを達成したPA-8800、2005年にはそれをさらに1.1GHzまで引き上げたPA-8900をそれぞれリリースした。
実際には動作周波数の向上以外にもキャッシュの容量引き上げやバスの高速化/バスI/Fの変更、さらにPA-8800/8900はデュアルコア化などの性能改善の方策を採るものの、根本的に自社のプロセスは0.5μm CMOSのCMOS-14Cで打ち止めになった。
それ以降は他社のプロセスを使わざるをえないため、結局1世代程度遅れたプロセスで競争することになり、これ以上継続しても競争力がないと判断した。これもあってItaniumに乗り換えたという話は連載121回でした通りだ。
Exemplar SPPの性能はそれなり
COMPAQを買収したことで計画を放逐
プロセッサーの話が終わったところでExemplar SPPに話を戻そう。HPはConvexを買収後、このSPPシリーズである程度はスパコン市場を握れると考えた節がある。
それもあって1995年11月のTOP500を見てみると、SPP 1000/SPP 1200であわせて17サイトほどが導入している。ちなみにSPPシリーズはCD(Compact System)とXA(eXtended Architecture)の2種類があり、CDは最大16プロセッサー、XAは最大128プロセッサーとなる。
おそらくCDはHypernodeが2つまでで1つのシャーシで接続され、XAは複数のシャーシをつなぐ形になっていたのだと思われる。
東京大学の喜連川優教授の研究室の旧ページの中の計算機環境に示されているHP-Convex Exemplarの写真が旧Convexの時代のものと思われる。
Convex由来の最後の製品が、1997年に投入されたSPP 2000である。基本構成は同じだが、クロスバースイッチが5×5から8×8に変更になり、Exemplar SPPの構造図で言うところの縦方向のリンクも8本になった(帯域はそれぞれ1.9GB/秒)。
メモリーコントローラーも8つになっている。CPUは180MHz駆動のPA-8000となり、1つのノード(Hypernode)には最大16個のPA-8000が搭載可能である。
この1ノードの構成がS-Classと呼ばれ、そのS-Classのマシンを複数台つないで最大32ノード・512CPUまで拡張できるようにしたものがX-Classと呼ばれる。
1997年当時のConvexのサイトにいくつか写真があるが、下の画像がそのX-Classのものである。これはS-Classの筐体を2つ縦積みにした構造だ。
画像の出典はInternet Archive
ちなみに1997年当時はもう少し安価に導入できる、D-ClassやK-Classといった製品も用意されたらしい。さら将来の製品ロードマップも示されていた。
画像の出典はInternet Archive
SPP 2000の性能を1997年11月のTOP500の結果を見てみると、最上位なのがNASAジェット推進研究所に納入された128プロセッサー構成のSPP 2000の63位である。理論性能92.16GFLOPSに対して実効性能51.30GFLOPSという効率の低さが気になるが、実はこれには理由がある。
NASAジェット推進研究所はこれとは別に256コアのExepmler X-Classのスコアを登録しているが、こちらのRmaxも51.3GFLOPSになっており、真面目に測定していない可能性が非常に大である。
とはいえ、競合製品と比較してなにかしらアドバンテージがあるか? といわれると非常に難しい程度の性能でしかなかった。
HPはこの後、製品ラインナップの名称をV2xxxシリーズに切り替える。まずPA-8200を搭載したものをV2200/V2250として1997~1998年に発売し、ついで1999年~2000年にはPA-8500/PA-8600を搭載したV2500/V2600を発売するが、Itaniumの発売の遅れもあり、結局ロードマップにあったItaniumベースのVシリーズは出ずじまいであった。
おまけにHPは2001年9月、COMPAQを買収することを決定するため、COMPAQが持っていたスパコン向けのラインナップ、つまりASCI Qと思いっきり被ることになる。
そうした事情もあり、V2500/V2600を最後に、ConvexのExemplarのアーキテクチャーも放逐されることになってしまった。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ