このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第725回

第4世代EPYCのBergamoとGenoa-Xの詳細が判明 AMD CPUロードマップ

2023年06月26日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

Bergamoの性能はXeon Platinumの約3.7倍

 さて肝心の性能である。そもそもBergamoはクラウドワーク向けのCPUとして設計された。ここで言うクラウドワークというものの説明が下の画像だ。

いやさすがに従来のアプリケーションではRuntimeが無限大ということはないと思うのだが……

 要するにBergamoが利用されるクラウド向けの場合、あるアプリケーションを長く動かすというよりも、極めて短い(下手をするとミリ秒オーダー)時間で処理をして、すぐ別の処理に切り替わる、というコンテクストスイッチングの多そうな処理が主体となる。

 こうした処理では大量のキャッシュを積んでも性能が上がりにくい(扱うべき処理データがミリ秒単位で変わるので、煩雑にメモリーをランダムアクセスする必要が出るので、キャッシュの効果が出にくい)し、そうなるとメモリーアクセス待ちの時間が結構長くなりがちなので、ターボなどで動作周波数を引き上げる前に下手をすると処理が終わりかねない。

 こうしたケースではコア数をそのまま増やす方が有利というわけだ。実際にクラウドワークの比較では競合を大きく上回る性能を発揮する、としている。

クラウドワークの比較。比較対象はSapphire RapidsベースのXeonと、ArmのNeoverse N1を128コア搭載するAmpereのAltra Maxである

 おもしろいのは製品SKUである。トップエンドはEPYC 9754で、これは128コアの構成だが、その下にSMTを無効化したEPYC 9754Sがラインナップされていることだ。

全製品とも3次キャッシュが256MBなので、つまり8ダイ構成ということになる。EPYC 9734は実際には112コアなので7ダイでも間に合うのだが、おそらくは各CCXあたり有効コア数を7に減らし、7×16=112という構成になっているものと思われる

 これは主に性能とライセンスに起因する。下の画像はMemcachedの性能を比較したものだが、要するにプロセッサーあたりの性能を高めたいのか、スレッドあたりの性能を高めたいのか、は顧客がどこにそれを使うのかで変わってくる。

折れ線がスレッドあたりのスループット(というか秒あたりオペレーション数)、縦棒はプロセッサーあたりのスループットである。最高のスループットはSMT有効なEPYC 9754だが、スレッドあたりではEPYC 9754Sの方が上である

 ただ、「ではスレッドあたりの性能を高めたければBIOS SetupでSMTを無効にすればオッケー」とはならないのは、ここにライセンスコストが絡んでくるためだ。クラウドではさまざまなアプリケーションが動いており、もちろん有償のものは多いのだが、そうした有償のアプリケーションの中には「プロセッサー数でライセンス料が決まる」「コア数でライセンスが決まる」「スレッド数でライセンスが決まる」とさまざまなものがある。

 ここで難しいのが、こうしたライセンスの場合は「BIOSでSMTを無効化したから128スレッドです」といっても通じず、256スレッド分のコストを要求されることだ。したがって、最初からSMTを無効にしたEPYC 9574Sを用意したというわけだ。こちらはBIOS SetupをいじってもSMTを有効化できないので、ライセンス料は128スレッド分で済む。

 AMDはさらに、Bergamoを利用した場合にサーバーをどれだけ削減できるかという試算も示しているがこれは一例でしかなく、構成によって損得はだいぶ変ってくるのであくまでも参考でしかない。

これはNGINXで375Mリクエスト/秒を処理するのにどれだけのサーバーが必要かを算出したもの。もっともこれ、よく見るとEPYC 9754の方も29サーバーでラックの電源供給能力(12KW)を使い切ってるあたり、TOR Switchを追加することもできなそうなあたり、やや現実味が薄い試算ではある

上の画像の試算を2P Serverベースに切り替え(上の画像は1P Serverベース)、Xeon Platinum 8490Hも加えたケース。Xeonはコア数が最大のものを選んだのだろうが、これは可哀そうな気も

上の画像でEPYCをSMT無効化した9754Sに切り替えた場合。わずか3台の増加で済んでいるあたりがポイント。もっともトータルの価格はEPYC 9754が1万1900ドル、EPYC 9754Sが1万200ドルなので、2P構成ではEPYC 9754の場合で35万7000ドル、EPYC 9754Sでは36万7200ドルとなる。ライセンスコストの差が、この差額(1万200ドル)より大きければお得であるのだが

 ちなみにDellがすでにこのBergamoを搭載した製品を4シリーズ用意したことも同時に発表された。

左の4製品は汎用ということで、GenoaとBergamoのどちらを使うかを選べる格好。他にHPC向けにPowerEdge C6525とPowerEdge XE8545がラインナップされるが、こちらはHPC向けということでGenoaのみでBergamoのラインナップは用意されない模様

カテゴリートップへ

この連載の記事