前回のTI ASCに比べれば多少新しいのが今回解説するFPS(Floating Point Systems, Inc.)のFPS Tシリーズである。
CRAY-1より安価なマシンを供給していた
FPS
FPSという会社は名前の通り、浮動小数点演算、つまり科学技術用の計算システムを製造・販売していたメーカーである。創立は1970年とけっこう古めで、最初の製品であるAP-120Bは1976年に発表された。
これはさまざまなホスト(例えばDECのPDP-11という16bitのミニコンピューター)と接続してアクセラレーターとして動作するもので、内部構造は下の画像のように加算と乗算ユニットを搭載し、これにメモリーとレジスターがくっついたシステムである。
同社はこれをScientific Array Processorと称している。命令セットは64bit長であるが、おもしろいのは内部が8つの8bit領域(Parcel)に分割され、それぞれ内部のユニットに対する処理を記述する方式になっていたことだ。
VLIWと異なるのは、あくまでこの8つのPercelで1つの命令を記述していることで、実際命令コード(OPERATION CODE)の領域は1つしかない。
では他のPercelはなにをやっているかといえば、例えばX Reg, Write Percelというのは結果をX Registerに書き込む場合、レジスターのどれを使うかを明示的に指定するものだ。
最近のCPUはこうしたものは自動的にCPU内部で割り当てを行なう仕組みが用意されているが、なにせ1976年のことなので、こうしたものを明示的にプログラマーが指定する必要があった。
もっとも、うまくやれば下の画像のようにパイプライン動作が可能になり、ベクトツプロセッサーと同じような性能が得られる。
※ここまでの画像出典は、FPS社のAlan E. Chaeleworth氏が1981年9月のIEEE COMPUTERに掲載した“AnApproach to Scientific Array Processing:The Architectural Design of the AP-120B/FPS-164 Family”という記事。
実際のスループットで言えば、乗加算(A+B×C)はスカラーで10サイクルなのがベクトルで3サイクル、除算(A/B)はスカラーで22サイクルなのがベクトルで7サイクルとされ、うまくデータをプログラマーが扱えば性能が大きく改善するとしている。
ちなみにデータ長は38bitという不思議なもので、これは当時APS-120Bがターゲットとしたアプリケーションでは32bitでは精度が足らず、64bitにすると無駄が多すぎるかららしい。
ただし、後継のFPS-164はこれを64bit幅に拡張している。APS-120Bのシステム全体の動作速度は6MHzで、理論性能では12MFLOPSということになる。CRAY-1の160MIPSに比べると見劣りはするが、その分価格も安かったようで、予算の少ない研究所や、医療用のイメージ処理など、CRAY-1クラスを導入できないところに好評だったらしい。
APS-120Bに続いて、やや性能を上げるとともにIBMのメインフレームに接続できるようにしたAP-190Lと、逆に信号処理向けの低価格品であるFPS-100がリリースされ、次いで1980年には先に述べた通り内部のデータ幅を64bit化したFPS-164が投入されている。
しかし、この頃の同社の競合製品はIBMであって、IBM 3081や、その後継として投入されたIBM 3090(ベクトル演算支援付き)などは、FPS-164を上回る性能を発揮した。
FPS-164の性能そのものは、11MFLOPS(若干動作速度が落ちた)こともあり、FPSは後追いで行列演算に特化させたFPS-164/MAXを投入する。これは、行列演算用の回路を追加することで22MFLOPSを実現した。
さらに後追いで、内部の回路をTTLからECLに変更することで5倍の動作周波数を実現したFPS-264も投入される。ただし性能そのものは3.5~4倍程度だったらしい。
もっとも、競合といってもIBMと顧客を奪い合うというよりは、性能を308x/3090より引き上げないとIBMに採用されなかった、という方が実情に近いかもしれない。
IBMは当時LCAP(Loosely Coupled Array of Processors)というシステムを構築しており、試験的に作られたLCAP/1とLCAP/2に続き、商用モデルとしてLCAP/3090というシステムを開発していた。
これはCRAY-1などに対抗するのに、単一の高性能プロセッサーの代わりに多数のアクセラレーターを接続してトータルでの性能アップを目指すという構成である。
※画像出典は、IBMが1986年に出した“Large-Scale Computations on a Scalar, Vector and Parallel Supercomputer”という論文。
ちなみにLCAPに関しては、単にIBMだけでなくDECのVAXシリーズとやはり同じような構成を取ったシステムを構築したりするなど、さまざまなものがあった。
いずれも目的は簡単で、CRAYに代表される高速なベクトルコンピューターの市場を、もう少し廉価に自社のシステムで代替できるようにするというもので、このビジネスは1991年にFPSがCRIに買収されるまで形を変えつつ続いた。
(→次ページヘ続く 「後継の超並列マシン、FPS Tシリーズ」)
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ