Blue Gene/Lと比較して
ほぼ2倍のプロセッサー密度を実現
このチップを搭載するコンピュートカードであるが、チップの消費電力が16Wと大きめになったためか、BlueGene/Lのカードあたり2チップの構成(関連リンク)が、BlueGene/Pでは1チップとなった。
相変わらずメモリーチップはカードに直付けで、容量は2GBないし4GBとされている。チップの数そのものは変わらず、チップの容量が後から倍増したようだ。
1つのコンピュートカードあたりの演算性能は13.6GFLOPSとされ、BlueGene/Lの11.2GFLOPSよりも動作周波数の分、性能が引きあがった形だ。
これを搭載するノードカードは下の画像のように32枚のコンピュートカード(と最大2枚のI/Oカード)を搭載する。
チップの位置をコンピュートカードの中心からややオフセットした関係で、ノードカードには画像のように2枚のコンピュートカードがうまく互い違いに収まるようになっており、ここでBlue Gene/Lと比較してほぼ2倍のプロセッサー密度が実現できた形だ。
実際Blue Gene/Lではノードカード1枚あたり179.2GFLOPSなのに対し、Blue Gene/Pでは435.2GFLOPSになっている。
ラックそのものはBlueGene/Lと共通のもので、フルに装着すると1キャビネットに32枚のノードカードを装着できる(Photo07~09)。つまりラックあたりの演算性能は最大で13.9TFLOPSとなる。
ほぼ14TFLOPSというところで、あとはラックをいくつ並べるかでトータルの性能が決まる。1PFLOPSならば71ラックほど並べれば済むことになる。BlueGene/Pが72ラック構成とされたのは、こうした理由である。
性能は向上したが
性能/消費電力比がRoadRunnerに劣る
BlueGene/Pを最初に導入したのはオークリッジ国立研究所で、2007年10月にはまず2ラックが導入され、このシステムを使ってさまざまなアプリケーション評価や導入試験などが行なわれる。
TOP500にはこの2ラック分の構成で21.9TFLOPSというスコアを出し、2007年11月に40位となっている。次に導入したのがアルゴンヌ国立研究所で、こちらは“Intrepid”という名前で40ラック構成のBlueGene/Pを2008年8月に導入した。TOP500の2008年6月にもぎりぎり間に合い、450.3TFLOPSで4位を獲得している。
もう少し後になるが、2009年6月のTOP500のリストを見てみると、上位100位以内に以下のところが入っている。
2009年6月のTOP500で、上位100位以内にあるBlueGene/P | ||||||
---|---|---|---|---|---|---|
順位 | 組織 | コア数 | 実効性能 | |||
3位 | 独ユーリヒ総合研究機構 | 29万4912個 | 825.5TFLOPS | |||
7位 | 米エネルギー省科学局 アルゴンヌ国立研究所 |
16万3840個 | 458.6TFLOPS | |||
9位 | 米エネルギー省科学局 米国家核安全保障局 ローレンス・リバモア国立研究所 |
14万7456個 | 415.7TFLOPS | |||
14位 | サウジアラビア キング・アブドゥッラー科学技術大学 | 6万5536個 | 185.2TFLOPS | |||
24位 | 仏IDRIS | 4万960個 | 116TFLOPS | |||
36位 | 仏EDF R&D | 3万2768個 | 93TFLOPS | |||
84位 | IBMロチェスター | 1万6384個 | 46.8TFLOPS | |||
85位 | IBMトーマス・J・ワトソン研究所 | 1万6384個 | 46.8TFLOPS | |||
86位 | 独マックス・プランク研究所 | 1万6384個 | 46.8TFLOPS |
まるっきり売れなかったわけでもないのだが、BlueGene/Lほどに売れたわけでもなかった。
根本的な問題として、BlueGene/LからBlueGene/Pでは、基本的に性能/消費電力比があまり向上しておらず、また計算性能の向上はもっぱらコア数の改善(要するにノードカードに装着するコンピュートカードの密度向上)によるところが大きいというあたりが敗因だろう。
実際、2009年6月にTOP500で3位になったユーリヒ総合研究機構のJUGENEの場合、72ラック構成で理論性能1002.7TFLOPSであるが、実効性能825.5TFLOPSで効率は82.3%、消費電力は2268KWで性能/消費電力比は363.3KFlops/Wとなり、どちらの数字もBlueGene/Lよりは改善しているものの、同時期に登場したRoadRunnerと比較すると効率はともかく性能/消費電力比では劣っている。電気代が運用コストの少なからぬ部分を占めている昨今ではもう一段改善が必要だ。
もっともこうした反省が次のBlueGene/Qに生きたわけで、BlueGene/LからBlueGene/Qへの橋渡し役としての仕事はきちんとこなせた、というのがBlueGene/Pの評価であろう。
※お詫びと訂正:TOP500の表に誤りがありました。訂正してお詫びします。(2015年5月27日)
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ