Bergamoの性能はXeon Platinumの約3.7倍
さて肝心の性能である。そもそもBergamoはクラウドワーク向けのCPUとして設計された。ここで言うクラウドワークというものの説明が下の画像だ。
要するにBergamoが利用されるクラウド向けの場合、あるアプリケーションを長く動かすというよりも、極めて短い(下手をするとミリ秒オーダー)時間で処理をして、すぐ別の処理に切り替わる、というコンテクストスイッチングの多そうな処理が主体となる。
こうした処理では大量のキャッシュを積んでも性能が上がりにくい(扱うべき処理データがミリ秒単位で変わるので、煩雑にメモリーをランダムアクセスする必要が出るので、キャッシュの効果が出にくい)し、そうなるとメモリーアクセス待ちの時間が結構長くなりがちなので、ターボなどで動作周波数を引き上げる前に下手をすると処理が終わりかねない。
こうしたケースではコア数をそのまま増やす方が有利というわけだ。実際にクラウドワークの比較では競合を大きく上回る性能を発揮する、としている。
おもしろいのは製品SKUである。トップエンドはEPYC 9754で、これは128コアの構成だが、その下にSMTを無効化したEPYC 9754Sがラインナップされていることだ。
![](/img/2023/06/25/3559007/l/b8d1279e2f5b7d1d.jpg)
全製品とも3次キャッシュが256MBなので、つまり8ダイ構成ということになる。EPYC 9734は実際には112コアなので7ダイでも間に合うのだが、おそらくは各CCXあたり有効コア数を7に減らし、7×16=112という構成になっているものと思われる
これは主に性能とライセンスに起因する。下の画像はMemcachedの性能を比較したものだが、要するにプロセッサーあたりの性能を高めたいのか、スレッドあたりの性能を高めたいのか、は顧客がどこにそれを使うのかで変わってくる。
![](/img/2023/06/25/3559008/l/c3b87a5608fcef52.jpg)
折れ線がスレッドあたりのスループット(というか秒あたりオペレーション数)、縦棒はプロセッサーあたりのスループットである。最高のスループットはSMT有効なEPYC 9754だが、スレッドあたりではEPYC 9754Sの方が上である
ただ、「ではスレッドあたりの性能を高めたければBIOS SetupでSMTを無効にすればオッケー」とはならないのは、ここにライセンスコストが絡んでくるためだ。クラウドではさまざまなアプリケーションが動いており、もちろん有償のものは多いのだが、そうした有償のアプリケーションの中には「プロセッサー数でライセンス料が決まる」「コア数でライセンスが決まる」「スレッド数でライセンスが決まる」とさまざまなものがある。
ここで難しいのが、こうしたライセンスの場合は「BIOSでSMTを無効化したから128スレッドです」といっても通じず、256スレッド分のコストを要求されることだ。したがって、最初からSMTを無効にしたEPYC 9574Sを用意したというわけだ。こちらはBIOS SetupをいじってもSMTを有効化できないので、ライセンス料は128スレッド分で済む。
AMDはさらに、Bergamoを利用した場合にサーバーをどれだけ削減できるかという試算も示しているがこれは一例でしかなく、構成によって損得はだいぶ変ってくるのであくまでも参考でしかない。
![](/img/2023/06/25/3559009/l/40abf3b4fed46608.jpg)
これはNGINXで375Mリクエスト/秒を処理するのにどれだけのサーバーが必要かを算出したもの。もっともこれ、よく見るとEPYC 9754の方も29サーバーでラックの電源供給能力(12KW)を使い切ってるあたり、TOR Switchを追加することもできなそうなあたり、やや現実味が薄い試算ではある
![](/img/2023/06/25/3559010/l/9a4e391313993874.jpg)
上の画像の試算を2P Serverベースに切り替え(上の画像は1P Serverベース)、Xeon Platinum 8490Hも加えたケース。Xeonはコア数が最大のものを選んだのだろうが、これは可哀そうな気も
![](/img/2023/06/25/3559011/l/bc0e013984adb7cb.jpg)
上の画像でEPYCをSMT無効化した9754Sに切り替えた場合。わずか3台の増加で済んでいるあたりがポイント。もっともトータルの価格はEPYC 9754が1万1900ドル、EPYC 9754Sが1万200ドルなので、2P構成ではEPYC 9754の場合で35万7000ドル、EPYC 9754Sでは36万7200ドルとなる。ライセンスコストの差が、この差額(1万200ドル)より大きければお得であるのだが
ちなみにDellがすでにこのBergamoを搭載した製品を4シリーズ用意したことも同時に発表された。
![](/img/blank.gif)
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ