前回まではCRAYシリーズ、正確にはCRI(Cray Research Inc.)とCCI(Cray Computer Inc.)の系譜を説明してきたが、こちらは基本的にベクトル型マシンであった。
命令フォーマットはSIMD(Single Instruction Multi Data)で、1つの命令で複数のデータに同じ処理を行なわせるというものである。
SIMDの場合、命令の解釈は最初の1回だけで、その後はひたすらデータの読み込み→実行→書き出しを行なうため、メモリーのロード・ストアさえ間に合えばピーク性能が出しやすい。
逆に言えば、このメモリーのロード・ストアが間に合わないと全然性能が出ないわけで、CRAY-3がお化けのようなメモリーシステムを実装したのも無理ないところだが、これは当然ながらコストアップにつながり、消費電力も凄まじいものになる。
Thinking Machines社のコネクションマシン「CM-1」。画像はComputer History Museumより
こうしたトレンドとはまた別の方向の研究も行なわれた。それはマルチプロセッサーの方向性である。1990年代にはMassively parallelなんて呼ばれ方をし、その後はGrid Computingという言い方に切り替わったが、中身はマルチプロセッサーである。
端的な話、今ではシングルコアのCPUなんてPCの世界でもごくわずかで、普通は2Pないし4Pのコアが搭載され、それを全部使い切ることでそれなりに快適なPC環境が実現できている。
同じように複数のCPUコアを用意し、それぞれに独自にプログラムを実行させればその分だけ性能が上がる。これをたくさん並べれば、その分だけ性能が上がるというわけだ。
もちろん話はそう簡単ではない。例えば全部のCPUでメモリーを共有すると、まず最初にメモリーがボトルネックになる。また、ある程度以上の個数のプロセッサーを接続しようとすると、今度はプロセッサー間の接続もボトルネックになる。
これはOSが密結合のマルチプロセッサーを前提としたものになっていることが最大の理由で、大規模なマルチプロセッサー構成は取りにくくなっている。
ただそうしたソフトウェアの互換性を無視すれば、例えばCPUとメモリーを一塊にして、その塊同士をネットワークでつなげば、ボトルネックは相対的に生じにくくなる。いわばPCクラスターをもっと小さい単位で実装するようなものである。もちろんこの場合でもネットワークをどう構築するかが最大の肝になる。
その大規模マルチプロセッサーに関する研究は特に80年代になってから盛んになった。そうした中でマサチューセッツ工科大学のWilliam Daniel Hillis博士が1981年9月に出した“The Connection Machine(Computer Architecture for the New Wave)”(関連リンク)というメモから始まったのが、今回紹介するThinking Machines社のコネクションマシンである。
並列コンピューティングを実現した
コネクションマシン
Hillis博士は当時MITのAI Labに属しており、その中で次世代のプロセッサーのあり方についていろいろな考察を行なっていた。このメモを見ていただければわかるが、メモそのものはプロセッサーのアーキテクチャーというよりは、もっと大きなMassive Parallelというシステムをどう構築すべきかについて論じたものである。
実はこれはHillis氏(まだ当時は修士)の博士論文の題材でもあるのだが、そこで博士号を取得するためにはメモの内容を実現する必要があった。
そこで氏はSheryl Handlerと共同でThinking Machines社を1983年に設立。ここで彼のメモの内容をCM-1(Connection Machine-1)として実装する。最終的にはこのCM-1に関する論文で氏は博士号を取得している。
→次のページヘ続く (6万5536個ものプロセッサーを並列処理させるCM-1)

この連載の記事
-
第864回
PC
なぜAMDはチップレットで勝利したのか? 2万ドルのウェハーから逆算する経済的合理性 -
第863回
PC
銅配線はなぜ限界なのか? ルテニウムへの移行で変わる半導体製造の常識と課題 -
第862回
PC
「ビル100階建て相当」の超難工事! DRAM微細化が限界を超え前人未到の垂直化へ突入 -
第861回
PC
INT4量子化+高度な電圧管理で消費電力60%削減かつ90%性能アップ! Snapdragon X2 Eliteの最先端技術を解説 -
第860回
PC
NVIDIAのVeraとRubinはPCIe Gen6対応、176スレッドの新アーキテクチャー搭載! 最高クラスの性能でAI開発を革新 -
第859回
デジタル
組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現 -
第858回
デジタル
CES 2026で実機を披露! AMDが発表した最先端AIラックHeliosの最新仕様を独自解説 -
第857回
PC
FinFETを超えるGAA構造の威力! Samsung推進のMBCFETが実現する高性能チップの未来 -
第856回
PC
Rubin Ultra搭載Kyber Rackが放つ100PFlops級ハイスペック性能と3600GB/s超NVLink接続の秘密を解析 -
第855回
PC
配線太さがジュース缶並み!? 800V DC供給で電力損失7~10%削減を可能にする次世代データセンターラック技術 -
第854回
PC
巨大ラジエーターで熱管理! NVIDIA GB200/300搭載NVL72ラックがもたらす次世代AIインフラの全貌 - この連載の一覧へ











