2週間空いてしまったが、スーパーコンピューターの話を続けよう。今回は再びアメリカに戻る。1984年、サンノゼでCydromeという会社が創立された。
創立メンバーはDavid Yen博士、Wei Yen博士、Ross A.Towle氏、、Arun Kumar氏、Bob R. Rau博士といった面々である。
ネタバレになるかもしれないが、これらの面々のその後の経歴を紹介しておくと、David W. Yen博士はSun Microsystemsの副社長やJuniper Networkの副社長、Ciscoの専務などを歴任。
Wei Yen博士はその後SGIの専務を勤めながら同時にArtXを創立、その後はいくつかの会社の取締役会に名前を連ねたり創立したりしつつ、現在はAcer Cloud Technologyを率いている。
Arun Kumar氏は、SGIのディレクターを経ていくつかの会社のCEO/CFOを勤め、現在はITA(International Trade Administration:アメリカ合衆国商務省国際貿易局)の次官補という役職に就かれている。
そしてCydra 5のチーフアーキテクトを勤めたBob R. Rau博士はHPの研究員となって2002年に逝去された。さて、このメンバーのその後の経歴に何かしら連想されるものがないだろうか? というのが今回のお題だ。
その話は後にするとして、このCydromeという会社は独自のアーキテクチャーのシステムであるCydra 5を開発した。まずはここから解説したい。
50~100万ドル程度で購入可能な
気軽に使えるシステム「Cydra 5」
Cydra 5の目的は、50~100万ドル程度で購入可能でありながら、1000~2000万ドルクラスのスーパーコンピューターの1/4~2/3程度の性能が期待できるシステムである。
彼らはこれを強調すべく、Cydra 5 Departmental Supercomputerと呼んでいた。Departmentalというのは部門の意味で、要するに組織全体で使うものではなく、部門ごとに導入して気軽(?)に使えるようなシステムを目指していたということだ。
もちろん、そんなシステムが簡単にできるわけもないので、さまざまなテクニックに加え、いくつかのトレードオフを考慮していた。
Cydra 5の元をたどると、米TRWのESL(Electromagnetic Systems Laboratory)が開発していたPolycyclic Architectureに基づくベクトルプロセッサーに行き着く。
一種のデータフロー・アーキテクチャー(データが来た順に処理を行なう仕組み)で、多くのデータフロー・アーキテクチャーと同じようにこれも非同期構成だったらしい。
Cydra 5は同期式のシステムなので、この点では異なるのだが、これに近い概念を実現するために複数種類のプロセッサーを混在するヘテロジニアス・マルチプロセッサーの構成を取った。
下図が全体の構成であるが、中核にあるのがインタラクティブ・プロセッサーで、ここが計算以外のほとんどの処理を担う。
※画像の出典はCydromeの“The Cydra 5 Departmental Supercomputer: Design Philosophies, Decisions and Trade-offs”(http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=47160)。以下の資料も出典は同じ。
I/O向けにはI/O Processorが別に用意され、またシステム管理用にService Processorも搭載されるが、計算処理は別に用意されたNumerical Processorが担うという仕組みだ。
ここでトレードオフとして、Numeric Processor以外は、トータルで10MIPS程度の性能があれば良いと割り切り、比較的低速なプロセッサーを複数並べる構成とした。
ちなみに10MIPSという数値は、Numeric Processorが必要とするデータの読み書きなどをハンドリングするのに、この程度があればなんとかなるという試算だった模様だ。
1984年の時点ではまだ主要なRISCプロセッサーはあくまでペーパープラン、もしくは設計中ということで、唯一利用できる製品はMotorolaの16MHz駆動のMC68020であった。
資料には明示的には書かれていないが、どうもNumeric Processor以外はすべて16MHz駆動のMC68020で実装した模様だ。性能的には33MHzのMC68020で5.36MIPSという数字があるので、16MHzだとおよそこの半分になる。
そこで、MC68020を複数個搭載した。最低限4つあれば合計で10MIPSを超えるが、実際はもう少し多く実装したようだ。
→次のページヘ続く (演算性能を上げるために細かい並列性を高める)
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ