Blue Gene/Lと比較して
ほぼ2倍のプロセッサー密度を実現
このチップを搭載するコンピュートカードであるが、チップの消費電力が16Wと大きめになったためか、BlueGene/Lのカードあたり2チップの構成(関連リンク)が、BlueGene/Pでは1チップとなった。
相変わらずメモリーチップはカードに直付けで、容量は2GBないし4GBとされている。チップの数そのものは変わらず、チップの容量が後から倍増したようだ。
1つのコンピュートカードあたりの演算性能は13.6GFLOPSとされ、BlueGene/Lの11.2GFLOPSよりも動作周波数の分、性能が引きあがった形だ。
これを搭載するノードカードは下の画像のように32枚のコンピュートカード(と最大2枚のI/Oカード)を搭載する。
チップの位置をコンピュートカードの中心からややオフセットした関係で、ノードカードには画像のように2枚のコンピュートカードがうまく互い違いに収まるようになっており、ここでBlue Gene/Lと比較してほぼ2倍のプロセッサー密度が実現できた形だ。
実際Blue Gene/Lではノードカード1枚あたり179.2GFLOPSなのに対し、Blue Gene/Pでは435.2GFLOPSになっている。
ラックそのものはBlueGene/Lと共通のもので、フルに装着すると1キャビネットに32枚のノードカードを装着できる(Photo07~09)。つまりラックあたりの演算性能は最大で13.9TFLOPSとなる。
ほぼ14TFLOPSというところで、あとはラックをいくつ並べるかでトータルの性能が決まる。1PFLOPSならば71ラックほど並べれば済むことになる。BlueGene/Pが72ラック構成とされたのは、こうした理由である。
性能は向上したが
性能/消費電力比がRoadRunnerに劣る
BlueGene/Pを最初に導入したのはオークリッジ国立研究所で、2007年10月にはまず2ラックが導入され、このシステムを使ってさまざまなアプリケーション評価や導入試験などが行なわれる。
TOP500にはこの2ラック分の構成で21.9TFLOPSというスコアを出し、2007年11月に40位となっている。次に導入したのがアルゴンヌ国立研究所で、こちらは“Intrepid”という名前で40ラック構成のBlueGene/Pを2008年8月に導入した。TOP500の2008年6月にもぎりぎり間に合い、450.3TFLOPSで4位を獲得している。
もう少し後になるが、2009年6月のTOP500のリストを見てみると、上位100位以内に以下のところが入っている。
| 2009年6月のTOP500で、上位100位以内にあるBlueGene/P | ||||||
|---|---|---|---|---|---|---|
| 順位 | 組織 | コア数 | 実効性能 | |||
| 3位 | 独ユーリヒ総合研究機構 | 29万4912個 | 825.5TFLOPS | |||
| 7位 | 米エネルギー省科学局 アルゴンヌ国立研究所 |
16万3840個 | 458.6TFLOPS | |||
| 9位 | 米エネルギー省科学局 米国家核安全保障局 ローレンス・リバモア国立研究所 |
14万7456個 | 415.7TFLOPS | |||
| 14位 | サウジアラビア キング・アブドゥッラー科学技術大学 | 6万5536個 | 185.2TFLOPS | |||
| 24位 | 仏IDRIS | 4万960個 | 116TFLOPS | |||
| 36位 | 仏EDF R&D | 3万2768個 | 93TFLOPS | |||
| 84位 | IBMロチェスター | 1万6384個 | 46.8TFLOPS | |||
| 85位 | IBMトーマス・J・ワトソン研究所 | 1万6384個 | 46.8TFLOPS | |||
| 86位 | 独マックス・プランク研究所 | 1万6384個 | 46.8TFLOPS | |||
まるっきり売れなかったわけでもないのだが、BlueGene/Lほどに売れたわけでもなかった。
根本的な問題として、BlueGene/LからBlueGene/Pでは、基本的に性能/消費電力比があまり向上しておらず、また計算性能の向上はもっぱらコア数の改善(要するにノードカードに装着するコンピュートカードの密度向上)によるところが大きいというあたりが敗因だろう。
実際、2009年6月にTOP500で3位になったユーリヒ総合研究機構のJUGENEの場合、72ラック構成で理論性能1002.7TFLOPSであるが、実効性能825.5TFLOPSで効率は82.3%、消費電力は2268KWで性能/消費電力比は363.3KFlops/Wとなり、どちらの数字もBlueGene/Lよりは改善しているものの、同時期に登場したRoadRunnerと比較すると効率はともかく性能/消費電力比では劣っている。電気代が運用コストの少なからぬ部分を占めている昨今ではもう一段改善が必要だ。
もっともこうした反省が次のBlueGene/Qに生きたわけで、BlueGene/LからBlueGene/Qへの橋渡し役としての仕事はきちんとこなせた、というのがBlueGene/Pの評価であろう。
※お詫びと訂正:TOP500の表に誤りがありました。訂正してお詫びします。(2015年5月27日)

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











