高速転送を可能にした
パラチャンネル
メモリーI/Fは64bit幅で、SDRAMに対応している。速度そのものは40/50/80MHzに対応とされており、80MHzを利用した場合のピーク帯域は640MB/秒とされた。プロセッサーの物理アドレスは30bitで、これにより最大1GBまでのメモリーを実装可能となっていた。
ちなみにECCにも対応しているため、64bitというのは純粋にデータバス幅であって、メモリーそのものは72bit構成と思われる。
チャンネルもまた大幅に強化された。最大16次元ということで、16対32本のチャンネルが用意されたが、nCUBE 2が20Mbps(実効速度は2.2MB/秒近辺)が50MB/秒まで引き上げられたとしている。
これは論文の記述に則ったものだが、この通りなら信号速度は450MHzほどになる(パリティ付きなので1Byteが9bitになる)計算なのだが、ややこれは怪しいところ。
当時の高速伝送技術を考えると、ウィキペディアの100Mbpsという記述の方が正確に思える。
単に信号の高速化だけでなく、ノードを経由してメッセージをやり取りする場合、Cut-Throughという、メッセージを全部受け取ってから転送をかけるのではなく、ヘッダーだけ確認してすぐに転送をかける方式を利用して、通常200ナノ秒未満でルーティング可能とされる。
またnCUBE 2まではI/Oも同じチャンネルを利用していたが、nCUBE 3ではI/O用にパラチャンネルと呼ばれる別のものが提供されるようになった。16個のノードが1つのパラチャンネルノードに接続される仕組みで、このノードとパラチャンネルノードの間は2対の独立した双方向リンクで接続される。
転送速度はそれぞれ20MB/秒となっており、しかも2対でフォールトトレランス(片方のリンクに障害があったら、自動的にもう片方で通信する)まで構成できるとする。
このパラチャンネルは、下の画像のようにノード(計算を行なうComputational node)とは別のHypercubeを構成する形となっており、I/Oノードは最大16のパラチャンネルノードで構成され、ピーク性能は800 64bit-Integer MIPSとされる。
こちらは通常のノードとは異なる構成で、I/O処理に特化するものだった。システム全体としては、下の画像のようにHIPPI(HIgh Performance Parallel Interface)やFDDI(Fiber-optic Digital Data Intaface)、イーサネットなどを利用して他のシステムと容易に接続可能と説明されている。
このnCUBE 3はSNLには納入されなかった。1994年11月に同社はプレスリリースを出し、nCUBE 3のシステムが1995年第2四半期から出荷可能で、エントリーシステム(具体的な構成は不明)は50万ドル未満であるとした。
全体としてどのくらいの台数が販売されたのかは定かではないが、国内ではJAIST(北陸先端科学技術大学院大学)が1996年3月に導入している(関連リンク)。
性能に関しては、iPSC/1、iPSC/2、iPSC/860とnCUBE 2およびnCUBE 3のシステムを比較した論文がある。この論文では複数のテストを行なったもので、結果としては下の画像のようになっている。
ただしiPSC/860のみ128ノード、他は全部64ノードでのテストなので一律に比較はできないものの、iPSC/860とnCUBE 3はどちらも前世代(iPSC/1、iPSC/2、nCUBE 2)に比べて大幅に性能が改善されたとしている。
また論文の中では、並行して実施されたSLALOMというプログラムを倍精度浮動小数点演算で実施した例も示され、64ノードのnCUBE 3が15.6MFLOPS、同じく64ノードのiPSC/860が134.8MFLOPSとされている。
これだけで見ればiPSC/860の圧勝だが、iPSC/860が最大でも128ノード構成なのに対し、nCUBE 3が最大6万5536ノードが可能なことを考えれば、トータル性能ではnCUBE 3が大きく伸ばすだろうと見ることもできる。
→次のページヘ続く (ビデオ配信に傾倒していくnCUBE社)
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ