このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第670回

スーパーコンピューターの系譜 TOP500で富岳を退けて首位に躍り出たFrontierの勝因

2022年06月06日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

今後の課題は効率を上げること

 現状、Frontierの理論ピーク値が1685.65PFlopsに対して実効性能が1102.00PFlopsというのは、効率65.4%で、あまり効率として誉められたものではない。実際今回TOP500の上位10位の効率(下表)を見ると、せめて70%はいってほしいところではある。

TOP500の上位10位
順位 スパコン 実効値
(PFlops)
理論値
(PFlops)
効率
1位 Frontier 1102.00 1685.65 65.4%
2位 富岳 442.01 537.21 82.3%
3位 LUMI 151.9 214.35 70.9%
4位 Summit 148.6 200.79 74.0%
5位 Sierra 94.64 125.71 75.3%
6位 TaihuLight 93.01 125.44 74.1%
7位 Perlmutter 70.87 93.75 75.6%
8位 Selene 63.46 79.22 80.1%
9位 Tianhe-2A 61.44 100.68 61.0%
10位 Adastra 46.1 61.61 74.8%

 もっともAMDのプレスリリースによれば、「今後、Frontierはシステムの継続的なテストと検証を続け、2022年後半の納品完了と早期アクセス、2023年初めのフルアクセス開始を目指している」ということで、現状はとりあえずシステムとROCm 5.0の動作検証のレベルで、まだ最適化の余地はあると考えられる。

 実際富岳にしても、2020年6月に初登録された時点の効率は80.9%で、その後現在の82.3%に向上している。効率については次回のTOP500の数字を見た方が良いだろう。

 さらに小規模なFrontier TDS(後述)はずっと効率が高いあたり、ノード数が増えたことによるネットワークアクセスのレイテンシーの大きさが効率の悪さの要因なように思える。このあたりをなんとかできれば、実効性能と効率がもっと向上しそうだ。

理化学研究所計算科学研究センターにある「富岳」

高い電力効率はAMD Instinct MI250Xによるもの

 一方でFrontierの電力効率は非常に高い。以下がTOP500の上位10位の数字である。

TOP500の上位10位
順位 スパコン 実効値
(PFlops)
消費電力
(KW)
効率
(GFlops/W)
1位 Frontier 1102.00 21100 52.2
2位 富岳 442.01 29899 14.8
3位 LUMI 151.9 2942 51.6
4位 Summit 148.6 10096 14.7
5位 Sierra 94.64 7438 12.7
6位 TaihuLight 93.01 15371 6.1
7位 Perlmutter 70.87 2589 27.4
8位 Selene 63.46 2646 24.0
9位 Tianhe-2A 61.44 18482 3.3
10位 Adastra 46.1 921 50.1

 Frontier/LUMI/Adastraの3システムがいずれも50GFlops/Wを達成しているが、実はこの3システムはいずれも第3世代EPYC+AMD Instinct MI250Xの組み合わせである。第3世代EPYC+NVIDIA A100のPerlmutterが半分強の27.4GFlops/Wなことを考えると、いかにAMD Instinct MI250Xが高効率かがわかる。

AMD Instinct MI250X

 こういうわけなので、当然Green500もトップをこの3システムが独占することになる。厳密に言えば、トップになったのはFrontierの導入に先立ってオークリッジ国立研究所に導入されたFrontier TDS(Test & Development System)であり、こちらは128ノード構成の小規模なものだ。

 それもあってTOP500では29位でしかないが、理論性能23.11PFlopsに対して実効性能19.20Flops(効率83.0%)を達成、消費電力は308.68KWで電力効率は62.7GFlops/Wに達する。Green500では、2020年6月と2021年6・11月の3期Preferred NetworksのMN-3が首位の座にあったが、今回は5位に落ちてしまった(40.9GFlops/W)。

 ちなみにHPCGに関しては、今回FrontierはエントリしていないがLUMIがエントリーしており、ランキング3位につけている(1935.73TFlops)。LUMIが1176ノード構成なことを考えると、Frontierならば15200TFlops程度は期待できそうで、トップの富岳(16004.5TFlops)に迫ることになる。最適化が進めばここでもトップを奪えそうな勢いだ。

※お詫びと訂正:記事初出時、Green500の順位に一部誤りがありました。記事を訂正してお詫びします。(2022年6月10日)

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン