このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第285回

スーパーコンピューターの系譜 本来の目的と違う方向に進んだnCUBE

2014年12月29日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

高速転送を可能にした
パラチャンネル

 メモリーI/Fは64bit幅で、SDRAMに対応している。速度そのものは40/50/80MHzに対応とされており、80MHzを利用した場合のピーク帯域は640MB/秒とされた。プロセッサーの物理アドレスは30bitで、これにより最大1GBまでのメモリーを実装可能となっていた。

 ちなみにECCにも対応しているため、64bitというのは純粋にデータバス幅であって、メモリーそのものは72bit構成と思われる。

 チャンネルもまた大幅に強化された。最大16次元ということで、16対32本のチャンネルが用意されたが、nCUBE 2が20Mbps(実効速度は2.2MB/秒近辺)が50MB/秒まで引き上げられたとしている。

 これは論文の記述に則ったものだが、この通りなら信号速度は450MHzほどになる(パリティ付きなので1Byteが9bitになる)計算なのだが、ややこれは怪しいところ。

 当時の高速伝送技術を考えると、ウィキペディアの100Mbpsという記述の方が正確に思える。

 単に信号の高速化だけでなく、ノードを経由してメッセージをやり取りする場合、Cut-Throughという、メッセージを全部受け取ってから転送をかけるのではなく、ヘッダーだけ確認してすぐに転送をかける方式を利用して、通常200ナノ秒未満でルーティング可能とされる。

 またnCUBE 2まではI/Oも同じチャンネルを利用していたが、nCUBE 3ではI/O用にパラチャンネルと呼ばれる別のものが提供されるようになった。16個のノードが1つのパラチャンネルノードに接続される仕組みで、このノードとパラチャンネルノードの間は2対の独立した双方向リンクで接続される。

 転送速度はそれぞれ20MB/秒となっており、しかも2対でフォールトトレランス(片方のリンクに障害があったら、自動的にもう片方で通信する)まで構成できるとする。

 このパラチャンネルは、下の画像のようにノード(計算を行なうComputational node)とは別のHypercubeを構成する形となっており、I/Oノードは最大16のパラチャンネルノードで構成され、ピーク性能は800 64bit-Integer MIPSとされる。

nCUBE 3の構造。出典は先の画像と同じ。一番左が計算ノード、中央がI/Oノードで、この間をつなぐのがパラチャンネルである

 こちらは通常のノードとは異なる構成で、I/O処理に特化するものだった。システム全体としては、下の画像のようにHIPPI(HIgh Performance Parallel Interface)やFDDI(Fiber-optic Digital Data Intaface)、イーサネットなどを利用して他のシステムと容易に接続可能と説明されている。

nCUBE 3のシステム全体像。これも出典は同じく。HIPPIは50ピンのツイストペアを使ったパラレルバスで、800Mbps(100MB/秒)での通信が可能なものである

 このnCUBE 3はSNLには納入されなかった。1994年11月に同社はプレスリリースを出し、nCUBE 3のシステムが1995年第2四半期から出荷可能で、エントリーシステム(具体的な構成は不明)は50万ドル未満であるとした。

 全体としてどのくらいの台数が販売されたのかは定かではないが、国内ではJAIST(北陸先端科学技術大学院大学)が1996年3月に導入している(関連リンク)。

 性能に関しては、iPSC/1、iPSC/2、iPSC/860とnCUBE 2およびnCUBE 3のシステムを比較した論文がある。この論文では複数のテストを行なったもので、結果としては下の画像のようになっている。

性能比較表。N6400が64ノードのnCUBE 3、N3200が64ノードのnCUBE 2である。出典は“Performance of the Intel iPSC/860 and Ncube 6400 hypercubes”

 ただしiPSC/860のみ128ノード、他は全部64ノードでのテストなので一律に比較はできないものの、iPSC/860とnCUBE 3はどちらも前世代(iPSC/1、iPSC/2、nCUBE 2)に比べて大幅に性能が改善されたとしている。

 また論文の中では、並行して実施されたSLALOMというプログラムを倍精度浮動小数点演算で実施した例も示され、64ノードのnCUBE 3が15.6MFLOPS、同じく64ノードのiPSC/860が134.8MFLOPSとされている。

 これだけで見ればiPSC/860の圧勝だが、iPSC/860が最大でも128ノード構成なのに対し、nCUBE 3が最大6万5536ノードが可能なことを考えれば、トータル性能ではnCUBE 3が大きく伸ばすだろうと見ることもできる。

→次のページヘ続く (ビデオ配信に傾倒していくnCUBE社

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン