Bergamoの性能はXeon Platinumの約3.7倍
さて肝心の性能である。そもそもBergamoはクラウドワーク向けのCPUとして設計された。ここで言うクラウドワークというものの説明が下の画像だ。
要するにBergamoが利用されるクラウド向けの場合、あるアプリケーションを長く動かすというよりも、極めて短い(下手をするとミリ秒オーダー)時間で処理をして、すぐ別の処理に切り替わる、というコンテクストスイッチングの多そうな処理が主体となる。
こうした処理では大量のキャッシュを積んでも性能が上がりにくい(扱うべき処理データがミリ秒単位で変わるので、煩雑にメモリーをランダムアクセスする必要が出るので、キャッシュの効果が出にくい)し、そうなるとメモリーアクセス待ちの時間が結構長くなりがちなので、ターボなどで動作周波数を引き上げる前に下手をすると処理が終わりかねない。
こうしたケースではコア数をそのまま増やす方が有利というわけだ。実際にクラウドワークの比較では競合を大きく上回る性能を発揮する、としている。
おもしろいのは製品SKUである。トップエンドはEPYC 9754で、これは128コアの構成だが、その下にSMTを無効化したEPYC 9754Sがラインナップされていることだ。
全製品とも3次キャッシュが256MBなので、つまり8ダイ構成ということになる。EPYC 9734は実際には112コアなので7ダイでも間に合うのだが、おそらくは各CCXあたり有効コア数を7に減らし、7×16=112という構成になっているものと思われる
これは主に性能とライセンスに起因する。下の画像はMemcachedの性能を比較したものだが、要するにプロセッサーあたりの性能を高めたいのか、スレッドあたりの性能を高めたいのか、は顧客がどこにそれを使うのかで変わってくる。
折れ線がスレッドあたりのスループット(というか秒あたりオペレーション数)、縦棒はプロセッサーあたりのスループットである。最高のスループットはSMT有効なEPYC 9754だが、スレッドあたりではEPYC 9754Sの方が上である
ただ、「ではスレッドあたりの性能を高めたければBIOS SetupでSMTを無効にすればオッケー」とはならないのは、ここにライセンスコストが絡んでくるためだ。クラウドではさまざまなアプリケーションが動いており、もちろん有償のものは多いのだが、そうした有償のアプリケーションの中には「プロセッサー数でライセンス料が決まる」「コア数でライセンスが決まる」「スレッド数でライセンスが決まる」とさまざまなものがある。
ここで難しいのが、こうしたライセンスの場合は「BIOSでSMTを無効化したから128スレッドです」といっても通じず、256スレッド分のコストを要求されることだ。したがって、最初からSMTを無効にしたEPYC 9574Sを用意したというわけだ。こちらはBIOS SetupをいじってもSMTを有効化できないので、ライセンス料は128スレッド分で済む。
AMDはさらに、Bergamoを利用した場合にサーバーをどれだけ削減できるかという試算も示しているがこれは一例でしかなく、構成によって損得はだいぶ変ってくるのであくまでも参考でしかない。
これはNGINXで375Mリクエスト/秒を処理するのにどれだけのサーバーが必要かを算出したもの。もっともこれ、よく見るとEPYC 9754の方も29サーバーでラックの電源供給能力(12KW)を使い切ってるあたり、TOR Switchを追加することもできなそうなあたり、やや現実味が薄い試算ではある
上の画像の試算を2P Serverベースに切り替え(上の画像は1P Serverベース)、Xeon Platinum 8490Hも加えたケース。Xeonはコア数が最大のものを選んだのだろうが、これは可哀そうな気も
上の画像でEPYCをSMT無効化した9754Sに切り替えた場合。わずか3台の増加で済んでいるあたりがポイント。もっともトータルの価格はEPYC 9754が1万1900ドル、EPYC 9754Sが1万200ドルなので、2P構成ではEPYC 9754の場合で35万7000ドル、EPYC 9754Sでは36万7200ドルとなる。ライセンスコストの差が、この差額(1万200ドル)より大きければお得であるのだが
ちなみにDellがすでにこのBergamoを搭載した製品を4シリーズ用意したことも同時に発表された。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ




