Ryzen 4000はインテルを圧倒できる性能になる AMD CPUロードマップ

文●大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

2020年02月03日 12時00分

 業界に多大な影響を与えた現存メーカーのHP編はお休みをいただき、久々にロードマップのアップデートをする。

 今年のCESではAMD・インテルともにいろいろと活発な発表を行なった。ただAMDに関しては記事が1本と寂しいので、もう少し細かな解説をお届けしたい。

 といっても、Radeon RX 5600 XTに関してはすでに細かな解説ベンチマークも掲載され、店頭出荷も始まっている状況なのであまり説明することもないからパスし、今回はRenoirを取り上げたい。

次期APU「Renoir」こと
Ryzen 4000シリーズ

 Renoirは7nmを使ったZen2+Vega 8CUのGPU統合製品である。Renoirについては連載536回の最後でも取り上げたが、お披露目がCESなのは合っていたものの、量産出荷は第1四半期中(といってももう2月に入ってしまったから、2月末~3月あたりか?)になったのが予想と異なるところだ。

 加えて言えば、筆者はRenoirを7nm CPU Chiplet+12nm GPU+I/O ChipletというMCM構成にしてくることを予想していたが、これに反してモノリシックダイでの提供となった。以下、CESで行われたプレスカンファレンスの資料をもとにもう少し解説する。

 ReniorことRyzen 4000 Series Mobileは、従来のRaven Ridge/Picassoと比較して大幅に性能を引き上げた、というのがまず最初のメッセージ。

End Noteを見る限り、グレーはCPU(というかAPU)単体。オレンジはCPU+Discrete GPU(Radeon RX 560)の数値を示している「らしい」のだが、なんとなく辻褄があってない気がする

 まずTDP 15Wのレンジに向けて、Ryzen 3 4300U~Ryzen 7 4800Uまで5製品がラインナップされた。

15W SKUに8コア製品を突っ込んでくるところはさすがである。15WということでそれなりにBase Frequencyは低く抑えられているが、ただ4コア/4スレッドのRyzen 3 4300UはBase 2.7GHzとかなり高めなことにも注意

 さてこのRyzen 4000 Series Mobileシリーズの競合は当然ながらIce Lakeになる。実はCES期間前日にあたる1月5日にインテルは記者説明会を現地で開催、ここでIce LakeベースのCore i7-1065G7がRyzen 7 3700Uを超えるグラフィック性能を発揮するというデモを開催しているのだが、AMDはそのCore i7-1065Gと比較して、CPU性能とGPU性能のどちらも上回っていることをアピールした。

シングルスレッド性能というかIPCで言えばおそらくIce Lakeに搭載されたSunny CoveがZen2を上回るが、動作周波数が低く抑えられているため、微妙に追いつけない状況。AMDも15W枠で8コア/16スレッドを動かすから、コアあたりの消費電力は1Wかそこらに抑えないといけない以上、それほど派手に動作周波数を引き上げにくいのは事実だが

 もちろんコアの数が多い分、マルチスレッド性能が効きやすいアプリケーションは当然Ryzen 7 4800Uの方が有利だし、ゲーミングについてもアドバンテージがあるとする。実はこれにはちょっとしたトリックがあるのだが、それは後述する。

これは予測できる結果ではある

さすがにQualityはLowに落とすのは必須だが、内蔵GPUでここまでいくのだからある意味すごい

 RenoirはおおむねPicassoと比べて2倍の性能/消費電力比を獲得しており、このうち3割がマイクロアーキテクチャによるもの、7割が7nmプロセスの採用によるものだとしている。

ちなみにこれはCPU側の話で、GPU側はVegaのままなので、単に7nmに移行したことによる効率化のみとなる

 ちなみにRenoirは、Ryzen/Threadripper/EPYCとはまた異なるデザインポリシーが取られている。

Power State Entry/Exitのレイテンシーが5Xだと、まるでレイテンシーが5倍に増えたように読めてしまう。これはCPUコア側だけでなく、チップセット側の設計にも絡んでくる部分であり、このあたりをモバイル向け(と将来の組み込み向け)に最適化したことも重要ではある

 それは主に省電力性に向けた話であるが、ここでポイントとなるのがLPDDR4xを新たにサポートしたことだ。連載505回でも書いたが、Ice Lakeに搭載されるGen 11 GPUは、最大64EU構成となる。

 これを支えるのがメモリーで、Ice LakeではDDR4-3200だけでなくLPDDR4-3733もサポートしている。インテルがベンチマークで見せる機種は当然LPDDR4-3733を搭載しており、DDR4よりも広いメモリー帯域のおかげでGPUも性能を発揮できるという話である。

 これへのカウンターパンチとして、AMDはLPDDR4xのサポートをRenoirに追加している。そして市場には、昨年からLPDDR4xが普通に流通している。これは主にスマートフォン向けではあるが、Samsungは昨年3月から、最大32Gbit(4GB)~96Gbit(12GB)のLPDDR4xチップを出荷しており、システムがこれを利用すればPicasso世代まで問題だった「メモリー帯域がボトルネックになってGPU性能がフルに発揮できない」問題がかなり緩和されることになる。

 おそらく今回AMDが示した結果は、LPDDR4x-4266を搭載しているのではないかと思う(脚注によれば“AMD Ryzen 4800U reference system”とだけあるため、構成が確認できない)。したがって、現時点でのRenoirはIce Lakeに比べてかなり良さそうな素性に仕上がっているというわだ。

Ryzen 4000シリーズは
45WのSKUが提供される

 加えてAMDは、新しく45WのSKUも提供することを明らかにした。こちらはゲーミングノートや、NUCなどでもそれなりに使えそうな消費電力枠である。ただゲーミングノート向け(=ディスクリートGPUを組み合わせるのが前提)がメインのようで、GPUは7CUに削減されているのがやや興味深い。

インテルは現状このH SkuにはCoffee Lakeベースの製品のみ提供している。35W動作も可能となっている

 実際性能評価も、ディスクリートGPUを組み合わせることを前提に3DMark FireStrikeのPhysics Testの結果が示されているあたりがこれを物語っている。

デスクトップ向けのCore i7-9700Kよりも高速、というあたりはおもしろいアピールの仕方である

 CineBenchの結果が下の画像だが、Ryzen 7 4800Hでベース2.9GHz/ブースト4.2GHzで、これはCore i9-9750Hのベース2.6GHz/最大ターボ4.5GHzとそれほど大きな差がない。

ただしコア数は2つ多いので、マルチスレッド性能は高くなる

 これもあって、シングルスレッド性能はあまり大きな差はない。逆にマルチスレッドでは当然アドバンテージがある。ゲーミング性能は特に示されていないが、これはディスクリートGPUを使うのが前提だからだろう。

それでもCineBench R20 1Tで5%ほどCoffee Lakeより性能が上回っているのはさすがである

これは上の画像などから考えれば妥当な結果だろう

 そのディスクリートGPUについては、今回AMD SmartShiftが発表された。

ただしこれは最低限、ディスクリートGPUにはVegaないしNaviが必須になる。ただ旧来のRadeon RX Vega Mobileに本当にこの機能が実装されているのかは不明である(そのうち関係者に確認せねば)

 もともとRyzenおよびVega以降のGPUに関しては、内部の制御はすべてInfinityFabricを利用している。 InfinityFabricにはControl FabricとData Fabricがあるが、このControl Fabric経由で細かな動作周波数や電圧などを調整している格好だ。

 RyzenのPrecision Boostなどもやはりこれを利用している。さて、CPU+ディスクリートGPUを利用する場合、それぞれのControl FabricはCPU内部およびディスクリートGPU内部で閉じてしまっているから、トータルでの電力制御ではなく、それぞれ個別に制御される。

 しかしながらノートPCの場合は供給電力も放熱能力も限られるため、トータルで制御される方が望ましい。そこで、外部(おそらくPCI Expressレーン)を利用して両方のControl Fabricの連携を取ることで、システム全体としての電力制御が可能になるという仕組みだ。

 これを使うことで、例えばCPU負荷が高い時はディスクリートGPUの動作周波数を下げ、逆にディスクリートGPUがフルに駆動するときはCPU側の動作周波数を下げるといった形で、CPU+ディスクリートGPU全体での消費電力を一定枠内に収めることが容易に可能になるというものだ。

Pentium Goldへの対抗として
7nmプロセスのAthlonを2製品投入

 また今回、7nmプロセスを利用したAthlonグレードの製品も2つ投入された。ついにAthlonにもGoldやSilverというグレードが誕生しており、言うまでもなくこれはPentium Goldへの対抗策という位置づけである。

ただSilverに関して言えば、Pentium SilverはTDP 6Wの製品なので、ある意味直接競合はしない。これはむしろCeleron 4000/5000シリーズへの対抗製品という位置づけだろう

 そのAthlon Gold 3150UとPentium Gold 5405Uの比較が下の画像で、性能的に圧倒できるとしている。

けっこう性能差があるが、Pentium Gold 5405UはTurbo Boostもないし、3次キャッシュも2MB(Athlon Gold 3150Uは4MB)なので、この程度の性能差があるのは無理もないところか

 ちなみに現時点では正確な発売日と価格は発表されていない。ただ、Ryzen 7 4800Uに関しては競合のCore i7-1065G7が426ドル、Athlon Gold 3150UについてはPentium Gold 5405Uが161ドルという価格になっており、どちらもこれに近い価格で提供されるのではないかと思われる。

 デスクトップ向けに比べるとやや価格が高めではあるが、これは特にモバイル向けがデスクトップよりややプレミアが載せられているためでもある。今年後半になると、このあたりもまた価格が急速に下落する可能性はあるが。AMDの説明によれば、今年中に100以上の製品がRenoirを搭載して出荷するとのことだった。

これはおそらくモバイルだけで、デスクトップ向けは含まれていないと思われる

Renoirのダイサイズを考察
8コアで42平方mmほどの面積か?

 さて、発表会の資料はこの程度であるが、もう少し内部を解析しよう。まずはダイサイズについて。本間文氏のレポートの中でパッケージ写真が示されていたが、やや画像サイズが小さい。そこで本間氏にお願いしてオリジナル画像を送ってもらい、トリミングとサイズ補正を施したのがこちらである。

これは本間文氏撮影の写真をレタッチしたもの。縦横の比率は、右上の2次元QRコードがちょうど正方形になるように調節した

 一方、Raven Ridge世代(のES品)のパッケージは連載412回で紹介している。仮に両方のパッケージのサイズが同じだとすると(見た限りでは同じFP5に見える)、RenoirのダイサイズはRaven Ridgeの66.7%ほどのサイズになると推定される。これは画像内のパッケージサイズとダイサイズの比からの類推である。

 Raven Ridgeのダイサイズが209.78mm2とされるので、ここからRenoirのダイサイズは139.9mm2ほど。おおむね140mm2と推定される。

 さて、この数字は正しいだろうか? 逆に内部のブロックサイズを推定してみたい。AMDは現時点でZen2ベースのダイの内部写真を公開していないが、Fritzchens Fritz氏がWikimediaにRyzen 5 3600のダイの表面を剥離させた写真をパブリックドメインとして公開しているので、ありがたくこれを使わせていただくことにした。

 画像を変形させて、真上から見た形にしたのが下の画像である。

ダイ中央を左右に走る部分が、I/OチップレットとつながるInfinityFabric用のI/Fと思われる

 内部を見ると、左上のブロックは下の画像のようになっていると思われる。

4つのL3 Blockの間を上下に走る部分は、3次キャッシュの制御部であろう

 Zen 2(既存のRyzen 4000シリーズ)の場合、3次キャッシュ容量がCCXあたり16MBになっている。つまり1コアあたり4MB相当になるわけだが、Renoirの場合は1コアあたり1MB、CCXあたり4MBまで3次キャッシュが削減されている計算になる。

 となると、Renoirの1コアあたりのレイアウトは画像の下側のようになると思われる。Matisseのダイサイズは74mm2と発表されており、画像サイズの比率から推定すると、Renoirでは1コア(+1MB L3)あたり5.25mm2ほど。これが8コアで42mm2ほどの面積になると推定される。

3次キャッシュの右のコントロール部は、とりあえず半分に減らしたが、おそらくもっと小さくなる

GPUのダイもおよそ40平方mm
インテルを圧倒できるスペック!

 次はGPUだ。7nmのVegaに関しては、昨年2月に発表されたRadeon VIIがある。下の画像はこのVega20のダイ写真を抜き出したものだ。

周囲にあるのはHBM2やInfinityFabric用のI/FとなるPHYなので、これは考慮する必要がない

 Vega20の場合は64CUだが、Renoirは8CUなので、最大でも下の画像のピンクの部分だけがあれば済むことになる。このピンクの部分の面積は、やはり画像サイズの比率から推定すると40mm2ほど。ということで、CPU+GPU「だけ」ならば、82mm2ほどで済む計算になる。

実際には制御部はもっと小さくて済みそうで、おそらくこれよりも3割ほど小さくなると思われる

 これはなかなか悪くない数字だ。実際にはこれに加えてメモリーコントローラーやPCI Express、さらにSATAやらなにやらのChipset Functionを搭載する必要がある。  Ryzen 3000シリーズで使われていたI/Oチップレットのダイサイズは125mm2と発表されているが、これはGlobalFoundriesの12LPを使ったものなので、7nmに持ってくればラフに言って半分に減るだろう。

 メモリーコントローラーの分は新規に足す必要があるが、外部接続用のInfinity FabricのI/Fは逆に要らなくなるので、多分それで相殺というあたりで、このChipset Functionの分が60mm2程度と想定すると、合計で142mm2。先に推定した140mm2程度、というReniorのダイサイズとかなり近い数字になる。

 この140mm2という数字は、以前こちら(https://ascii.jp/elem/000/001/873/1873186/4/)で紹介したIce Lakeの131mm2という数字にかなり近い。

 先代のRaven Ridge/Piccasoが210mm2ほどで、これはインテルの同じ4コア+GPUというKaby Lake(126mm2)はもとより、8コア+GPUのCoffee Lake Refresh(178mm2)と比較してもかなり大きい。

 ダイサイズが大きい=原価が高いであり、AMDの営業利益が低い要因の1つであったのだが、ここに来てほぼ同じダイサイズに抑えられたことで、インテル並みの利益率を期待できるようになった。しかも8コアである。なかなか強烈というか、インテルを圧倒できるスペックに仕上がったことがおわかりいただけよう。

■関連記事