「次は連載でなにやりましょう?」「プロセスルールの話でナノやマイクロといった小さい数字が続いたので、今度は大きな数字の話がいいです」「(なんだそれ)大きい、というとスパコンとかですかね」「あ、それいいですね、やりましょう」
……という、担当編集氏との白熱した議論の結果、今回からスーパーコンピューターの系譜について説明していく。今回は0回目というか系譜の事前準備という形で、スーパーコンピューターそのものに触れていきたい。

スーパーコンピューターの代表作
CRAY-1
そもそもこの手の話をする場合、スーパーコンピューターってなに? という問題が常に付きまとう。例えばスーパーコンピューターの代表例として名高い「CRAY-1」であるが、性能はどの程度かというと80MHz駆動で160MFLOPSとなっている。
CRAY-1もいろいろ派生型があって性能もまちまちなのだが、ここではCRAY Historyに出てきた数字を利用している。
この160MFLOPS(1秒間に1億6000万回の浮動小数点演算が行なえる)という性能であるが、実はARMの「Cortex-M4」というMCUコアに、オプションで用意されるFPUのスループットが1MFLOPS/MHz(ただし単精度のみ)であり、160MHz駆動のCortex-M4Fマイコンとほぼ同程度の性能ということになる。
NXPは最大204MHz駆動のLPC4300シリーズを昨年ラインナップしており、これにもFPUが搭載されているから、ピーク性能は確実にCRAY-1を抜いている。
もう少し一般的なところでは、2008年にインテルからネットブック向けプロセッサーとして発売された「Atom N270」のFPU性能は2.1GFLOPSに達するといった性能評価もあるほどで、今からすればCRAY-1の性能はそこらへんのマイコン程度でしかない、ということになる。
もちろんこの評価は公平ではない。CRAY-1がリリースされたのは1976年で、Cortex-M4やAtom N270がリリースされるまでに30年以上の時間が経過しているわけで、この時期を無視して議論するのはフェアではない。
では逆にCRAY-1が登場した1976年はどんなプロセッサーがあったのだろうか。インテルが8085をリリースしたばかりの頃である。8085は8080の後継品で、動作周波数はこの当時は3MHzどまりでなかったかと記憶している。
整数演算性能は3MIPSという計算になるが、FPUは搭載しておらず、外付けでも存在しないので、どうしても浮動小数点演算を行なおうとするとソフトウェアでのエミュレーションとなる。この当時に8085で浮動小数点演算をエミュレーションでやらせた場合の性能は探したが見つからなかった。
ただ一般にFPUをALU(整数演算ユニット)でエミュレーションすると50~1000倍程度時間がかかる(これはなにと比較するかによってばらつきが大きい)から、とりあえず100倍とすると、8085の性能はおそらく0.03MFLOPSほどになる。CRAY-1と比較すると5000倍以上の性能差になるわけだ。
マイコンではなくメインフレームではどうかというと、翌年の1977年にIBMは「IBM 3033」と呼ばれるプロセッサーをリリースしている。System/370として知られる、仮想記憶を実装したシステム向けのハイエンドプロセッサーで、IBMでは“The Big One”と呼んでいた(関連リンク)。
これがどの程度の速度かというと、これまた資料が乏しいのだが、こちらの表を見ると、1973年にラインナップされているIBM370/158がmy MIPS換算で0.64、LINPACKの速度が0.23MFLOPSとされている。1978年のIBM3033では、my MIPS換算が2.37となっており、ここから計算するとLINPACKの性能はおおよそ0.85MFLOPS程度と推定される。
一方前述の表には、CRAY-1の結果も1978年に入っており、こちらは堂々12MFLOPSである。IBMの3033の価格は360万ドル(当時のドル/円の為替レートは268円前後だったので、日本円にすると約10億円相当)で、一方CRAY-1は800万ドル(同じく21億4000万円相当)とさらに高価ではあったが、10倍以上の性能差に対して価格差は2.5倍だから、ずいぶん「お安い」買い物だったという考え方もできる。
→次のページヘ続く (Pentium 4を5120台並べれば地球シミュレータを抜けるか?)
※編注:記事の内容についての指摘をいくつか受けていますが、その点に関しては次回更新分(連載273回)で補足いたします。

この連載の記事
- 第722回 インテルの最新パッケージング技術でCPUが100×100mmに拡大 インテル CPUロードマップ
- 第721回 性能ではなく効率を上げる方向に舵を切ったTensilica AI Platform AIプロセッサーの昨今
- 第720回 Meteor Lakeには4次キャッシュが存在する インテル CPUロードマップ
- 第719回 EUV露光で堀った溝を削って広げる新技法Sculpta EUVによる露光プロセスの推移
- 第718回 引火性危険物で冷却しないといけない露光機 EUVによる露光プロセスの推移
- 第717回 要求にあわせて構成を変更できるSynopsysのARCシリーズ AIプロセッサーの昨今
- 第716回 Radeon Pro W7900/W7800が異様に安い価格で投入される理由 AMD GPUロードマップ
- 第715回 Emerald Rapidsは2023年第4四半期に量産開始 インテル CPUロードマップ
- 第714回 AMDのメディアアクセラレーター「Alveo MA35D」はナニがすごいのか?
- 第713回 Tenstorrentが日本支社を設立、自動運転の市場開拓が狙い AIプロセッサーの昨今
- 第712回 推論をわずか20mWで実行するエッジAIチップ「ERGO」 AIプロセッサーの昨今
- この連載の一覧へ