スーパーコンピューターの系譜　メモリーを持たないKSR-1

2015年11月02日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII.jp

1キャビネット以内の構成では性能を発揮

　Cellを構成するプロセッサーそのものは40bitのアドレス空間を持つ(KSR-2では64bitになった)。さすがに1088個ものCellがアドレス空間を共用すると、連続的にアドレスをマッピングしたとしてもCellの識別だけで11bit必要だ。

　一方、ローカルキャッシュの32MBには25bit必要なので、最低でも36bitアドレスが必要になる。この時点で汎用のプロセッサーでは足りない(ほとんどが32bitアドレス)ことになる。なので、チップそのものはKSR製の独自のものである。

　内部は4つのブロックに分かれており、以下で構成される。

CEU(Cell Execution Unit)	命令の解釈や一部の実行を行なう。
XIU(I/O Processor)	名前の通りI/O処理を行なう。
IPU(Integer Processing Unit)	整数演算を行なう。
FPU(Floating Point Unit)	浮動小数点演算を行なう。

　ちなみに英国のeBayにこのKSR-1のチップだけが出品されているのだが、チップそのものは6種類(3-1333-01～3-1138-01)ある。

KSR-1のボード写真。この1枚のボードにコンピュートノード×2が搭載されている。出典はWikipedia(https://en.wikipedia.org/wiki/File:Ksr_cell_top.jpg)

　KSR-1のボード写真を見ると1コンピュートノードあたりこれらのチップを合計で12個利用している。内訳は下記のとおり。

チップ名	個数
3-1333	1個
3-1334	1個
3-1335	1個
3-1336	1個
3-1337	4個
3-1338	4個

　おそらく基板で右下にある3-1333～3-1336がCEU/XIU/IPU/FPUで、その左脇にあるSRAM×8がサブキャッシュ(合計512KB)、上段の8つのチップは32MBのローカルカッシュで、その周りにあるものがローカルキャッシュ用のTag RAMではないかと思うのだが、確証はない。

　命令セットは2命令同時実行のVILWであり、CEU/XIU向けの命令×1とIPU/FPU向けの命令×1を同時に実行できる。FPUは1サイクルあたり最大2つの計算が可能(乗加算命令を同時に実行可能だった模様)となっている。

　なお、動作周波数そのものは20MHzで、このためCellあたりの最大性能は40MFLOPSという計算になる。ちなみにKSR-1はシャープの1.2μm CMOSプロセスで製造された。

　超並列でしかもALLCACHEアーキテクチャーという尖った構成だけに、プログラミングはさぞ難しかろうという気もするのだが、少なくともKSRはこの点に関してかなり努力はした。

　C/C++に加え、Micro Focus COBOL(Micro Focusは1976年以来ずっとCOBOLを提供し続けてきているベンダーで、現在も存在する)、Oracle PRDBMS、ADBのMATISSE OODBMS(オブジェクト指向データベース)などが提供されており、またOSとしてはUNIXベース(OSF/1の派生型：Machカーネルベースという説明もあった)が提供された。

　さて、最初の製品は1991年9月にオークリッジ国立研究所に納入された。当初は32cellの構成(つまりRing 0が1個だけ)で、翌1992年にはこれが64cellの構成になった。

　下の画像がその構造だが、Photo02のボードを2枚(つまり4cell)収めたキャビネット×8が1つのラックに収められているようだ。