前回まではCRAYシリーズ、正確にはCRI(Cray Research Inc.)とCCI(Cray Computer Inc.)の系譜を説明してきたが、こちらは基本的にベクトル型マシンであった。
命令フォーマットはSIMD(Single Instruction Multi Data)で、1つの命令で複数のデータに同じ処理を行なわせるというものである。
SIMDの場合、命令の解釈は最初の1回だけで、その後はひたすらデータの読み込み→実行→書き出しを行なうため、メモリーのロード・ストアさえ間に合えばピーク性能が出しやすい。
逆に言えば、このメモリーのロード・ストアが間に合わないと全然性能が出ないわけで、CRAY-3がお化けのようなメモリーシステムを実装したのも無理ないところだが、これは当然ながらコストアップにつながり、消費電力も凄まじいものになる。
こうしたトレンドとはまた別の方向の研究も行なわれた。それはマルチプロセッサーの方向性である。1990年代にはMassively parallelなんて呼ばれ方をし、その後はGrid Computingという言い方に切り替わったが、中身はマルチプロセッサーである。
端的な話、今ではシングルコアのCPUなんてPCの世界でもごくわずかで、普通は2Pないし4Pのコアが搭載され、それを全部使い切ることでそれなりに快適なPC環境が実現できている。
同じように複数のCPUコアを用意し、それぞれに独自にプログラムを実行させればその分だけ性能が上がる。これをたくさん並べれば、その分だけ性能が上がるというわけだ。
もちろん話はそう簡単ではない。例えば全部のCPUでメモリーを共有すると、まず最初にメモリーがボトルネックになる。また、ある程度以上の個数のプロセッサーを接続しようとすると、今度はプロセッサー間の接続もボトルネックになる。
これはOSが密結合のマルチプロセッサーを前提としたものになっていることが最大の理由で、大規模なマルチプロセッサー構成は取りにくくなっている。
ただそうしたソフトウェアの互換性を無視すれば、例えばCPUとメモリーを一塊にして、その塊同士をネットワークでつなげば、ボトルネックは相対的に生じにくくなる。いわばPCクラスターをもっと小さい単位で実装するようなものである。もちろんこの場合でもネットワークをどう構築するかが最大の肝になる。
その大規模マルチプロセッサーに関する研究は特に80年代になってから盛んになった。そうした中でマサチューセッツ工科大学のWilliam Daniel Hillis博士が1981年9月に出した“The Connection Machine(Computer Architecture for the New Wave)”(関連リンク)というメモから始まったのが、今回紹介するThinking Machines社のコネクションマシンである。
並列コンピューティングを実現した
コネクションマシン
Hillis博士は当時MITのAI Labに属しており、その中で次世代のプロセッサーのあり方についていろいろな考察を行なっていた。このメモを見ていただければわかるが、メモそのものはプロセッサーのアーキテクチャーというよりは、もっと大きなMassive Parallelというシステムをどう構築すべきかについて論じたものである。
実はこれはHillis氏(まだ当時は修士)の博士論文の題材でもあるのだが、そこで博士号を取得するためにはメモの内容を実現する必要があった。
そこで氏はSheryl Handlerと共同でThinking Machines社を1983年に設立。ここで彼のメモの内容をCM-1(Connection Machine-1)として実装する。最終的にはこのCM-1に関する論文で氏は博士号を取得している。
→次のページヘ続く (6万5536個ものプロセッサーを並列処理させるCM-1)
この連載の記事
-
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ