今後の課題は効率を上げること
現状、Frontierの理論ピーク値が1685.65PFlopsに対して実効性能が1102.00PFlopsというのは、効率65.4%で、あまり効率として誉められたものではない。実際今回TOP500の上位10位の効率(下表)を見ると、せめて70%はいってほしいところではある。
TOP500の上位10位 | ||||||
---|---|---|---|---|---|---|
順位 | スパコン | 実効値 (PFlops) |
理論値 (PFlops) |
効率 | ||
1位 | Frontier | 1102.00 | 1685.65 | 65.4% | ||
2位 | 富岳 | 442.01 | 537.21 | 82.3% | ||
3位 | LUMI | 151.9 | 214.35 | 70.9% | ||
4位 | Summit | 148.6 | 200.79 | 74.0% | ||
5位 | Sierra | 94.64 | 125.71 | 75.3% | ||
6位 | TaihuLight | 93.01 | 125.44 | 74.1% | ||
7位 | Perlmutter | 70.87 | 93.75 | 75.6% | ||
8位 | Selene | 63.46 | 79.22 | 80.1% | ||
9位 | Tianhe-2A | 61.44 | 100.68 | 61.0% | ||
10位 | Adastra | 46.1 | 61.61 | 74.8% |
もっともAMDのプレスリリースによれば、「今後、Frontierはシステムの継続的なテストと検証を続け、2022年後半の納品完了と早期アクセス、2023年初めのフルアクセス開始を目指している」ということで、現状はとりあえずシステムとROCm 5.0の動作検証のレベルで、まだ最適化の余地はあると考えられる。
実際富岳にしても、2020年6月に初登録された時点の効率は80.9%で、その後現在の82.3%に向上している。効率については次回のTOP500の数字を見た方が良いだろう。
さらに小規模なFrontier TDS(後述)はずっと効率が高いあたり、ノード数が増えたことによるネットワークアクセスのレイテンシーの大きさが効率の悪さの要因なように思える。このあたりをなんとかできれば、実効性能と効率がもっと向上しそうだ。
高い電力効率はAMD Instinct MI250Xによるもの
一方でFrontierの電力効率は非常に高い。以下がTOP500の上位10位の数字である。
TOP500の上位10位 | ||||||
---|---|---|---|---|---|---|
順位 | スパコン | 実効値 (PFlops) |
消費電力 (KW) |
効率 (GFlops/W) |
||
1位 | Frontier | 1102.00 | 21100 | 52.2 | ||
2位 | 富岳 | 442.01 | 29899 | 14.8 | ||
3位 | LUMI | 151.9 | 2942 | 51.6 | ||
4位 | Summit | 148.6 | 10096 | 14.7 | ||
5位 | Sierra | 94.64 | 7438 | 12.7 | ||
6位 | TaihuLight | 93.01 | 15371 | 6.1 | ||
7位 | Perlmutter | 70.87 | 2589 | 27.4 | ||
8位 | Selene | 63.46 | 2646 | 24.0 | ||
9位 | Tianhe-2A | 61.44 | 18482 | 3.3 | ||
10位 | Adastra | 46.1 | 921 | 50.1 |
Frontier/LUMI/Adastraの3システムがいずれも50GFlops/Wを達成しているが、実はこの3システムはいずれも第3世代EPYC+AMD Instinct MI250Xの組み合わせである。第3世代EPYC+NVIDIA A100のPerlmutterが半分強の27.4GFlops/Wなことを考えると、いかにAMD Instinct MI250Xが高効率かがわかる。
こういうわけなので、当然Green500もトップをこの3システムが独占することになる。厳密に言えば、トップになったのはFrontierの導入に先立ってオークリッジ国立研究所に導入されたFrontier TDS(Test & Development System)であり、こちらは128ノード構成の小規模なものだ。
それもあってTOP500では29位でしかないが、理論性能23.11PFlopsに対して実効性能19.20Flops(効率83.0%)を達成、消費電力は308.68KWで電力効率は62.7GFlops/Wに達する。Green500では、2020年6月と2021年6・11月の3期Preferred NetworksのMN-3が首位の座にあったが、今回は5位に落ちてしまった(40.9GFlops/W)。
ちなみにHPCGに関しては、今回FrontierはエントリしていないがLUMIがエントリーしており、ランキング3位につけている(1935.73TFlops)。LUMIが1176ノード構成なことを考えると、Frontierならば15200TFlops程度は期待できそうで、トップの富岳(16004.5TFlops)に迫ることになる。最適化が進めばここでもトップを奪えそうな勢いだ。
※お詫びと訂正:記事初出時、Green500の順位に一部誤りがありました。記事を訂正してお詫びします。(2022年6月10日)
この連載の記事
-
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ - この連載の一覧へ