今後の課題は効率を上げること
現状、Frontierの理論ピーク値が1685.65PFlopsに対して実効性能が1102.00PFlopsというのは、効率65.4%で、あまり効率として誉められたものではない。実際今回TOP500の上位10位の効率(下表)を見ると、せめて70%はいってほしいところではある。
| TOP500の上位10位 | ||||||
|---|---|---|---|---|---|---|
| 順位 | スパコン | 実効値 (PFlops) |
理論値 (PFlops) |
効率 | ||
| 1位 | Frontier | 1102.00 | 1685.65 | 65.4% | ||
| 2位 | 富岳 | 442.01 | 537.21 | 82.3% | ||
| 3位 | LUMI | 151.9 | 214.35 | 70.9% | ||
| 4位 | Summit | 148.6 | 200.79 | 74.0% | ||
| 5位 | Sierra | 94.64 | 125.71 | 75.3% | ||
| 6位 | TaihuLight | 93.01 | 125.44 | 74.1% | ||
| 7位 | Perlmutter | 70.87 | 93.75 | 75.6% | ||
| 8位 | Selene | 63.46 | 79.22 | 80.1% | ||
| 9位 | Tianhe-2A | 61.44 | 100.68 | 61.0% | ||
| 10位 | Adastra | 46.1 | 61.61 | 74.8% | ||
もっともAMDのプレスリリースによれば、「今後、Frontierはシステムの継続的なテストと検証を続け、2022年後半の納品完了と早期アクセス、2023年初めのフルアクセス開始を目指している」ということで、現状はとりあえずシステムとROCm 5.0の動作検証のレベルで、まだ最適化の余地はあると考えられる。
実際富岳にしても、2020年6月に初登録された時点の効率は80.9%で、その後現在の82.3%に向上している。効率については次回のTOP500の数字を見た方が良いだろう。
さらに小規模なFrontier TDS(後述)はずっと効率が高いあたり、ノード数が増えたことによるネットワークアクセスのレイテンシーの大きさが効率の悪さの要因なように思える。このあたりをなんとかできれば、実効性能と効率がもっと向上しそうだ。
高い電力効率はAMD Instinct MI250Xによるもの
一方でFrontierの電力効率は非常に高い。以下がTOP500の上位10位の数字である。
| TOP500の上位10位 | ||||||
|---|---|---|---|---|---|---|
| 順位 | スパコン | 実効値 (PFlops) |
消費電力 (KW) |
効率 (GFlops/W) |
||
| 1位 | Frontier | 1102.00 | 21100 | 52.2 | ||
| 2位 | 富岳 | 442.01 | 29899 | 14.8 | ||
| 3位 | LUMI | 151.9 | 2942 | 51.6 | ||
| 4位 | Summit | 148.6 | 10096 | 14.7 | ||
| 5位 | Sierra | 94.64 | 7438 | 12.7 | ||
| 6位 | TaihuLight | 93.01 | 15371 | 6.1 | ||
| 7位 | Perlmutter | 70.87 | 2589 | 27.4 | ||
| 8位 | Selene | 63.46 | 2646 | 24.0 | ||
| 9位 | Tianhe-2A | 61.44 | 18482 | 3.3 | ||
| 10位 | Adastra | 46.1 | 921 | 50.1 | ||
Frontier/LUMI/Adastraの3システムがいずれも50GFlops/Wを達成しているが、実はこの3システムはいずれも第3世代EPYC+AMD Instinct MI250Xの組み合わせである。第3世代EPYC+NVIDIA A100のPerlmutterが半分強の27.4GFlops/Wなことを考えると、いかにAMD Instinct MI250Xが高効率かがわかる。
こういうわけなので、当然Green500もトップをこの3システムが独占することになる。厳密に言えば、トップになったのはFrontierの導入に先立ってオークリッジ国立研究所に導入されたFrontier TDS(Test & Development System)であり、こちらは128ノード構成の小規模なものだ。
それもあってTOP500では29位でしかないが、理論性能23.11PFlopsに対して実効性能19.20Flops(効率83.0%)を達成、消費電力は308.68KWで電力効率は62.7GFlops/Wに達する。Green500では、2020年6月と2021年6・11月の3期Preferred NetworksのMN-3が首位の座にあったが、今回は5位に落ちてしまった(40.9GFlops/W)。
ちなみにHPCGに関しては、今回FrontierはエントリしていないがLUMIがエントリーしており、ランキング3位につけている(1935.73TFlops)。LUMIが1176ノード構成なことを考えると、Frontierならば15200TFlops程度は期待できそうで、トップの富岳(16004.5TFlops)に迫ることになる。最適化が進めばここでもトップを奪えそうな勢いだ。
※お詫びと訂正:記事初出時、Green500の順位に一部誤りがありました。記事を訂正してお詫びします。(2022年6月10日)

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ













