このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第305回

スーパーコンピューターの系譜 プロセッサー密度を上げたBlueGene/P

2015年05月25日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

Blue Gene/Lと比較して
ほぼ2倍のプロセッサー密度を実現

 このチップを搭載するコンピュートカードであるが、チップの消費電力が16Wと大きめになったためか、BlueGene/Lのカードあたり2チップの構成(関連リンク)が、BlueGene/Pでは1チップとなった。

BlueGene/Pのコンピュートカード。カードそのものは従来よりもやや小さくなったので、密度は上がったことになる。これ以降の出典はローレンス・リバモア国立研究所のBlueGene/Pのページ(https://computing.llnl.gov/tutorials/bgp/)より

 相変わらずメモリーチップはカードに直付けで、容量は2GBないし4GBとされている。チップの数そのものは変わらず、チップの容量が後から倍増したようだ。

 1つのコンピュートカードあたりの演算性能は13.6GFLOPSとされ、BlueGene/Lの11.2GFLOPSよりも動作周波数の分、性能が引きあがった形だ。

 これを搭載するノードカードは下の画像のように32枚のコンピュートカード(と最大2枚のI/Oカード)を搭載する。

ノードカードの横幅そのものはBlue Gene/Lと一緒だが、コンピュートカードの横幅が狭くなった分、中央にはややゆとりが生まれている

 チップの位置をコンピュートカードの中心からややオフセットした関係で、ノードカードには画像のように2枚のコンピュートカードがうまく互い違いに収まるようになっており、ここでBlue Gene/Lと比較してほぼ2倍のプロセッサー密度が実現できた形だ。

 実際Blue Gene/Lではノードカード1枚あたり179.2GFLOPSなのに対し、Blue Gene/Pでは435.2GFLOPSになっている。

 ラックそのものはBlueGene/Lと共通のもので、フルに装着すると1キャビネットに32枚のノードカードを装着できる(Photo07~09)。つまりラックあたりの演算性能は最大で13.9TFLOPSとなる。

 ほぼ14TFLOPSというところで、あとはラックをいくつ並べるかでトータルの性能が決まる。1PFLOPSならば71ラックほど並べれば済むことになる。BlueGene/Pが72ラック構成とされたのは、こうした理由である。

一見すると上下それぞれ8枚のノードカードが装着されているように見えるが、この裏側にも同じだけのノードカードが装着できる

ノードカードをフル実装した状態を横から見た写真。実際にはこちら側から排気される

左の写真の裏側は、60個のリムーバブルファンが実装されている。冷却システムそのものはBlueGene/Lと違いがない

性能は向上したが
性能/消費電力比がRoadRunnerに劣る

 BlueGene/Pを最初に導入したのはオークリッジ国立研究所で、2007年10月にはまず2ラックが導入され、このシステムを使ってさまざまなアプリケーション評価や導入試験などが行なわれる。

 TOP500にはこの2ラック分の構成で21.9TFLOPSというスコアを出し、2007年11月に40位となっている。次に導入したのがアルゴンヌ国立研究所で、こちらは“Intrepid”という名前で40ラック構成のBlueGene/Pを2008年8月に導入した。TOP500の2008年6月にもぎりぎり間に合い、450.3TFLOPSで4位を獲得している。

 もう少し後になるが、2009年6月のTOP500のリストを見てみると、上位100位以内に以下のところが入っている。

2009年6月のTOP500で、上位100位以内にあるBlueGene/P
順位 組織 コア数 実効性能
3位 独ユーリヒ総合研究機構 29万4912個 825.5TFLOPS
7位 米エネルギー省科学局
アルゴンヌ国立研究所
16万3840個 458.6TFLOPS
9位 米エネルギー省科学局
米国家核安全保障局
ローレンス・リバモア国立研究所
14万7456個 415.7TFLOPS
14位 サウジアラビア キング・アブドゥッラー科学技術大学 6万5536個 185.2TFLOPS
24位 仏IDRIS 4万960個 116TFLOPS
36位 仏EDF R&D 3万2768個 93TFLOPS
84位 IBMロチェスター 1万6384個 46.8TFLOPS
85位 IBMトーマス・J・ワトソン研究所 1万6384個 46.8TFLOPS
86位 独マックス・プランク研究所 1万6384個 46.8TFLOPS

 まるっきり売れなかったわけでもないのだが、BlueGene/Lほどに売れたわけでもなかった。

 根本的な問題として、BlueGene/LからBlueGene/Pでは、基本的に性能/消費電力比があまり向上しておらず、また計算性能の向上はもっぱらコア数の改善(要するにノードカードに装着するコンピュートカードの密度向上)によるところが大きいというあたりが敗因だろう。

 実際、2009年6月にTOP500で3位になったユーリヒ総合研究機構のJUGENEの場合、72ラック構成で理論性能1002.7TFLOPSであるが、実効性能825.5TFLOPSで効率は82.3%、消費電力は2268KWで性能/消費電力比は363.3KFlops/Wとなり、どちらの数字もBlueGene/Lよりは改善しているものの、同時期に登場したRoadRunnerと比較すると効率はともかく性能/消費電力比では劣っている。電気代が運用コストの少なからぬ部分を占めている昨今ではもう一段改善が必要だ。

 もっともこうした反省が次のBlueGene/Qに生きたわけで、BlueGene/LからBlueGene/Qへの橋渡し役としての仕事はきちんとこなせた、というのがBlueGene/Pの評価であろう。

※お詫びと訂正:TOP500の表に誤りがありました。訂正してお詫びします。(2015年5月27日)

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン