「次は連載でなにやりましょう?」「プロセスルールの話でナノやマイクロといった小さい数字が続いたので、今度は大きな数字の話がいいです」「(なんだそれ)大きい、というとスパコンとかですかね」「あ、それいいですね、やりましょう」
……という、担当編集氏との白熱した議論の結果、今回からスーパーコンピューターの系譜について説明していく。今回は0回目というか系譜の事前準備という形で、スーパーコンピューターそのものに触れていきたい。
スーパーコンピューターの代表作
CRAY-1
そもそもこの手の話をする場合、スーパーコンピューターってなに? という問題が常に付きまとう。例えばスーパーコンピューターの代表例として名高い「CRAY-1」であるが、性能はどの程度かというと80MHz駆動で160MFLOPSとなっている。
CRAY-1もいろいろ派生型があって性能もまちまちなのだが、ここではCRAY Historyに出てきた数字を利用している。
この160MFLOPS(1秒間に1億6000万回の浮動小数点演算が行なえる)という性能であるが、実はARMの「Cortex-M4」というMCUコアに、オプションで用意されるFPUのスループットが1MFLOPS/MHz(ただし単精度のみ)であり、160MHz駆動のCortex-M4Fマイコンとほぼ同程度の性能ということになる。
NXPは最大204MHz駆動のLPC4300シリーズを昨年ラインナップしており、これにもFPUが搭載されているから、ピーク性能は確実にCRAY-1を抜いている。
もう少し一般的なところでは、2008年にインテルからネットブック向けプロセッサーとして発売された「Atom N270」のFPU性能は2.1GFLOPSに達するといった性能評価もあるほどで、今からすればCRAY-1の性能はそこらへんのマイコン程度でしかない、ということになる。
もちろんこの評価は公平ではない。CRAY-1がリリースされたのは1976年で、Cortex-M4やAtom N270がリリースされるまでに30年以上の時間が経過しているわけで、この時期を無視して議論するのはフェアではない。
では逆にCRAY-1が登場した1976年はどんなプロセッサーがあったのだろうか。インテルが8085をリリースしたばかりの頃である。8085は8080の後継品で、動作周波数はこの当時は3MHzどまりでなかったかと記憶している。
整数演算性能は3MIPSという計算になるが、FPUは搭載しておらず、外付けでも存在しないので、どうしても浮動小数点演算を行なおうとするとソフトウェアでのエミュレーションとなる。この当時に8085で浮動小数点演算をエミュレーションでやらせた場合の性能は探したが見つからなかった。
ただ一般にFPUをALU(整数演算ユニット)でエミュレーションすると50~1000倍程度時間がかかる(これはなにと比較するかによってばらつきが大きい)から、とりあえず100倍とすると、8085の性能はおそらく0.03MFLOPSほどになる。CRAY-1と比較すると5000倍以上の性能差になるわけだ。
マイコンではなくメインフレームではどうかというと、翌年の1977年にIBMは「IBM 3033」と呼ばれるプロセッサーをリリースしている。System/370として知られる、仮想記憶を実装したシステム向けのハイエンドプロセッサーで、IBMでは“The Big One”と呼んでいた(関連リンク)。
これがどの程度の速度かというと、これまた資料が乏しいのだが、こちらの表を見ると、1973年にラインナップされているIBM370/158がmy MIPS換算で0.64、LINPACKの速度が0.23MFLOPSとされている。1978年のIBM3033では、my MIPS換算が2.37となっており、ここから計算するとLINPACKの性能はおおよそ0.85MFLOPS程度と推定される。
一方前述の表には、CRAY-1の結果も1978年に入っており、こちらは堂々12MFLOPSである。IBMの3033の価格は360万ドル(当時のドル/円の為替レートは268円前後だったので、日本円にすると約10億円相当)で、一方CRAY-1は800万ドル(同じく21億4000万円相当)とさらに高価ではあったが、10倍以上の性能差に対して価格差は2.5倍だから、ずいぶん「お安い」買い物だったという考え方もできる。
→次のページヘ続く (Pentium 4を5120台並べれば地球シミュレータを抜けるか?)
※編注:記事の内容についての指摘をいくつか受けていますが、その点に関しては次回更新分(連載273回)で補足いたします。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 -
第864回
PC
なぜAMDはチップレットで勝利したのか? 2万ドルのウェハーから逆算する経済的合理性 -
第863回
PC
銅配線はなぜ限界なのか? ルテニウムへの移行で変わる半導体製造の常識と課題 -
第862回
PC
「ビル100階建て相当」の超難工事! DRAM微細化が限界を超え前人未到の垂直化へ突入 -
第861回
PC
INT4量子化+高度な電圧管理で消費電力60%削減かつ90%性能アップ! Snapdragon X2 Eliteの最先端技術を解説 -
第860回
PC
NVIDIAのVeraとRubinはPCIe Gen6対応、176スレッドの新アーキテクチャー搭載! 最高クラスの性能でAI開発を革新 -
第859回
デジタル
組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現 -
第858回
デジタル
CES 2026で実機を披露! AMDが発表した最先端AIラックHeliosの最新仕様を独自解説 - この連載の一覧へ











