ピーク性能よりも性能/消費電力比を重視
最後に動作周波数周りの話をする。たとえばハイエンドになるEPYC 7742の場合の動作周波数とActive Core数の関係は下の画像のようになっている。
ピーク性能よりも、平均性能あるいは性能/消費電力比を悪化させない、というのがパフォーマンスの基本になっており、命令セットによる消費電力調整がない(インテルのAVX2/AVX512オフセットに相当するものがない)というあたりも、無理に動作周波数を引き上げていないことが見て取れる。
性能はむしろコア数で稼ぐ方向であり、このあたりは7nmプロセスにしたことで、コア数にゆとりが出たこ事の反映とみて良いだろう。
製品のラインナップであるが、下の画像が2 Socket向け、さらにその下の画像が1 Socket向けである。この2 Socket向けについて初代のEPYCと混ぜる形で動作周波数およびTDPをまとめたのが表である。
第1世代と第2世代EPYCの動作周波数およびTDP(太字が第2世代) | ||||||
---|---|---|---|---|---|---|
モデルナンバー | コア数 | ベースクロック(GHz) | 最大ブースト クロック(GHz) |
最小cTDP(W) | デフォルトTDP(W) | 最大cTDP(W) |
7251 | 8 | 2.10 | 2.90 | 120 | ||
7252 | 8 | 3.10 | 3.20 | 120 | 150 | |
7261 | 8 | 2.50 | 2.90 | 155 | 170 | |
7262 | 8 | 3.20 | 3.40 | 155 | 180 | |
7272 | 12 | 2.90 | 3.20 | 120 | 150 | |
7281 | 16 | 2.10 | 2.70 | 155 | 170 | |
7282 | 16 | 2.80 | 3.20 | 120 | 150 | |
7301 | 16 | 2.20 | 2.70 | 155 | 170 | |
7302 | 16 | 3.00 | 3.30 | 155 | 180 | |
7351 | 16 | 2.40 | 2.90 | 155 | 170 | |
7352 | 24 | 2.30 | 3.20 | 155 | 180 | |
7371 | 16 | 3.10 | 3.60 | 200 | ||
7401 | 24 | 2.30 | 3.20 | 155 | 170 | |
7402 | 24 | 2.80 | 3.35 | 165 | 180 | 200 |
7451 | 24 | 2.00 | 3.00 | 180 | ||
7452 | 32 | 2.35 | 3.35 | 155 | 180 | |
7501 | 32 | 2.00 | 3.00 | 155 | 170 | |
7502 | 32 | 2.50 | 3.35 | 165 | 180 | 200 |
7542 | 32 | 2.90 | 3.40 | 225 | 240 | |
7551 | 32 | 2.20 | 3.00 | 180 | ||
7552 | 48 | 2.20 | 3.30 | 165 | 200 | |
7601 | 32 | 2.20 | 3.20 | 180 | ||
7642 | 48 | 2.30 | 3.30 | 225 | 240 | |
7702 | 64 | 2.00 | 3.35 | 165 | 200 | |
7742 | 64 | 2.25 | 3.40 | 225 | 240 | |
※太字が第2世代EPYC |
初代EPYCはモデルナンバーの末尾が1、第2世代は末尾が2となっていることでそれとわかる。比較してみると、たとえば同じ8コアの7251と7252では、ベース周波数が1GHz以上引き上げられているし、16コアの7301と7302でもやはり結構な引き上げになっている。
32コアの7501と7502では、さすがに7502が定格ではTDPが180Wになるので、Configurable TDPで165Wの動作モードを提供しており、この場合では多少最大動作周波数は落ちると思うのだが、それでもベース周波数は2.5GHzまで引き上げられているあたり、同じコア数であれば確実に動作周波数のアップが実現されている。
あるい初代EPYCの32コア製品である7501と、第2世代で64コアの7702を比較すると、ほぼ同じTDP(155W vs 165W)で同じベース周波数ながらコア数が倍増しているわけで、アップグレードによって確実に性能がアップしている(あるいは性能/消費電力比が大幅に改善している)ことが推定できる。
ところで先ほど触れた性能の話を。下の画像はInteger PerformanceとServer Side Javaの性能を比較したものだが、メモリー帯域が8chのままでもほぼコア数が倍(32c64t→64c128t)になると性能が倍増しているあたりは、大容量3次キャッシュが良い仕事をしているということだろう。
このあたりは実アプリケーションで検証の必要はあるのだが、AMDによればメモリーが8chのままでも十分スケールするというのが第2世代EPYCに対するメッセージということである。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ