ピーク性能よりも性能/消費電力比を重視
最後に動作周波数周りの話をする。たとえばハイエンドになるEPYC 7742の場合の動作周波数とActive Core数の関係は下の画像のようになっている。
ピーク性能よりも、平均性能あるいは性能/消費電力比を悪化させない、というのがパフォーマンスの基本になっており、命令セットによる消費電力調整がない(インテルのAVX2/AVX512オフセットに相当するものがない)というあたりも、無理に動作周波数を引き上げていないことが見て取れる。
性能はむしろコア数で稼ぐ方向であり、このあたりは7nmプロセスにしたことで、コア数にゆとりが出たこ事の反映とみて良いだろう。
製品のラインナップであるが、下の画像が2 Socket向け、さらにその下の画像が1 Socket向けである。この2 Socket向けについて初代のEPYCと混ぜる形で動作周波数およびTDPをまとめたのが表である。
第1世代と第2世代EPYCの動作周波数およびTDP(太字が第2世代) | ||||||
---|---|---|---|---|---|---|
モデルナンバー | コア数 | ベースクロック(GHz) | 最大ブースト クロック(GHz) |
最小cTDP(W) | デフォルトTDP(W) | 最大cTDP(W) |
7251 | 8 | 2.10 | 2.90 | 120 | ||
7252 | 8 | 3.10 | 3.20 | 120 | 150 | |
7261 | 8 | 2.50 | 2.90 | 155 | 170 | |
7262 | 8 | 3.20 | 3.40 | 155 | 180 | |
7272 | 12 | 2.90 | 3.20 | 120 | 150 | |
7281 | 16 | 2.10 | 2.70 | 155 | 170 | |
7282 | 16 | 2.80 | 3.20 | 120 | 150 | |
7301 | 16 | 2.20 | 2.70 | 155 | 170 | |
7302 | 16 | 3.00 | 3.30 | 155 | 180 | |
7351 | 16 | 2.40 | 2.90 | 155 | 170 | |
7352 | 24 | 2.30 | 3.20 | 155 | 180 | |
7371 | 16 | 3.10 | 3.60 | 200 | ||
7401 | 24 | 2.30 | 3.20 | 155 | 170 | |
7402 | 24 | 2.80 | 3.35 | 165 | 180 | 200 |
7451 | 24 | 2.00 | 3.00 | 180 | ||
7452 | 32 | 2.35 | 3.35 | 155 | 180 | |
7501 | 32 | 2.00 | 3.00 | 155 | 170 | |
7502 | 32 | 2.50 | 3.35 | 165 | 180 | 200 |
7542 | 32 | 2.90 | 3.40 | 225 | 240 | |
7551 | 32 | 2.20 | 3.00 | 180 | ||
7552 | 48 | 2.20 | 3.30 | 165 | 200 | |
7601 | 32 | 2.20 | 3.20 | 180 | ||
7642 | 48 | 2.30 | 3.30 | 225 | 240 | |
7702 | 64 | 2.00 | 3.35 | 165 | 200 | |
7742 | 64 | 2.25 | 3.40 | 225 | 240 | |
※太字が第2世代EPYC |
初代EPYCはモデルナンバーの末尾が1、第2世代は末尾が2となっていることでそれとわかる。比較してみると、たとえば同じ8コアの7251と7252では、ベース周波数が1GHz以上引き上げられているし、16コアの7301と7302でもやはり結構な引き上げになっている。
32コアの7501と7502では、さすがに7502が定格ではTDPが180Wになるので、Configurable TDPで165Wの動作モードを提供しており、この場合では多少最大動作周波数は落ちると思うのだが、それでもベース周波数は2.5GHzまで引き上げられているあたり、同じコア数であれば確実に動作周波数のアップが実現されている。
あるい初代EPYCの32コア製品である7501と、第2世代で64コアの7702を比較すると、ほぼ同じTDP(155W vs 165W)で同じベース周波数ながらコア数が倍増しているわけで、アップグレードによって確実に性能がアップしている(あるいは性能/消費電力比が大幅に改善している)ことが推定できる。
ところで先ほど触れた性能の話を。下の画像はInteger PerformanceとServer Side Javaの性能を比較したものだが、メモリー帯域が8chのままでもほぼコア数が倍(32c64t→64c128t)になると性能が倍増しているあたりは、大容量3次キャッシュが良い仕事をしているということだろう。
このあたりは実アプリケーションで検証の必要はあるのだが、AMDによればメモリーが8chのままでも十分スケールするというのが第2世代EPYCに対するメッセージということである。
この連載の記事
-
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ