「次は連載でなにやりましょう?」「プロセスルールの話でナノやマイクロといった小さい数字が続いたので、今度は大きな数字の話がいいです」「(なんだそれ)大きい、というとスパコンとかですかね」「あ、それいいですね、やりましょう」
……という、担当編集氏との白熱した議論の結果、今回からスーパーコンピューターの系譜について説明していく。今回は0回目というか系譜の事前準備という形で、スーパーコンピューターそのものに触れていきたい。
スーパーコンピューターの代表作
CRAY-1
そもそもこの手の話をする場合、スーパーコンピューターってなに? という問題が常に付きまとう。例えばスーパーコンピューターの代表例として名高い「CRAY-1」であるが、性能はどの程度かというと80MHz駆動で160MFLOPSとなっている。
CRAY-1もいろいろ派生型があって性能もまちまちなのだが、ここではCRAY Historyに出てきた数字を利用している。
この160MFLOPS(1秒間に1億6000万回の浮動小数点演算が行なえる)という性能であるが、実はARMの「Cortex-M4」というMCUコアに、オプションで用意されるFPUのスループットが1MFLOPS/MHz(ただし単精度のみ)であり、160MHz駆動のCortex-M4Fマイコンとほぼ同程度の性能ということになる。
NXPは最大204MHz駆動のLPC4300シリーズを昨年ラインナップしており、これにもFPUが搭載されているから、ピーク性能は確実にCRAY-1を抜いている。
もう少し一般的なところでは、2008年にインテルからネットブック向けプロセッサーとして発売された「Atom N270」のFPU性能は2.1GFLOPSに達するといった性能評価もあるほどで、今からすればCRAY-1の性能はそこらへんのマイコン程度でしかない、ということになる。
もちろんこの評価は公平ではない。CRAY-1がリリースされたのは1976年で、Cortex-M4やAtom N270がリリースされるまでに30年以上の時間が経過しているわけで、この時期を無視して議論するのはフェアではない。
では逆にCRAY-1が登場した1976年はどんなプロセッサーがあったのだろうか。インテルが8085をリリースしたばかりの頃である。8085は8080の後継品で、動作周波数はこの当時は3MHzどまりでなかったかと記憶している。
整数演算性能は3MIPSという計算になるが、FPUは搭載しておらず、外付けでも存在しないので、どうしても浮動小数点演算を行なおうとするとソフトウェアでのエミュレーションとなる。この当時に8085で浮動小数点演算をエミュレーションでやらせた場合の性能は探したが見つからなかった。
ただ一般にFPUをALU(整数演算ユニット)でエミュレーションすると50~1000倍程度時間がかかる(これはなにと比較するかによってばらつきが大きい)から、とりあえず100倍とすると、8085の性能はおそらく0.03MFLOPSほどになる。CRAY-1と比較すると5000倍以上の性能差になるわけだ。
マイコンではなくメインフレームではどうかというと、翌年の1977年にIBMは「IBM 3033」と呼ばれるプロセッサーをリリースしている。System/370として知られる、仮想記憶を実装したシステム向けのハイエンドプロセッサーで、IBMでは“The Big One”と呼んでいた(関連リンク)。
これがどの程度の速度かというと、これまた資料が乏しいのだが、こちらの表を見ると、1973年にラインナップされているIBM370/158がmy MIPS換算で0.64、LINPACKの速度が0.23MFLOPSとされている。1978年のIBM3033では、my MIPS換算が2.37となっており、ここから計算するとLINPACKの性能はおおよそ0.85MFLOPS程度と推定される。
一方前述の表には、CRAY-1の結果も1978年に入っており、こちらは堂々12MFLOPSである。IBMの3033の価格は360万ドル(当時のドル/円の為替レートは268円前後だったので、日本円にすると約10億円相当)で、一方CRAY-1は800万ドル(同じく21億4000万円相当)とさらに高価ではあったが、10倍以上の性能差に対して価格差は2.5倍だから、ずいぶん「お安い」買い物だったという考え方もできる。
→次のページヘ続く (Pentium 4を5120台並べれば地球シミュレータを抜けるか?)
※編注:記事の内容についての指摘をいくつか受けていますが、その点に関しては次回更新分(連載273回)で補足いたします。
この連載の記事
-
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 - この連載の一覧へ