第3世代RyzenとNAVIで追加された新機能 AMD CPU/GPUロードマップ

文●大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

2019年07月01日 12時00分

 前回前々回に引き続き、Next Horizon Gamingイベントで公開された話を解説しよう。今回はCPUとGPU、両方で書ききれなかった細かな話を紹介していく。

第3世代のRyzenの
ラインナップ

 まずはCPU編。前回はラインナップすら示す余地がなかったわけだが、第3世代のRyzenとしては下の画像の5製品がまず7月7日に発売され、これに加えて9月にRyzen 9 3950Xが追加で発売されることになる。

第3世代Ryzenのラインナップ。トップエンドでCore i9-9900Kと同じ499ドルを付けるとか、Ryzen 7 3800XがCore i7-9700Kよりも価格を上にしているあたりに、製品競争力に猛烈な自信があることが見て取れる

 実はこれに加えて、6月11日にRyzen Gも2製品追加されている。どちらも基本的な構成は従来のRyzen 3 2200G/Ryzen 5 2400Gと同じであるが、CPUコアとGPUコアの両方の動作周波数が向上しているものだ。

3000番台をつけるが、こちらは12nmプロセスを利用した第2世代のRyzen Gである

 特にRyzen 5 3400GはTDPが65Wのままでありながら、95W対応のリテールクーラーWraith Spireを付属させたり、TIMの材質を改善したりといった、オーバークロック動作を前提とした特徴が目立つ製品になっている。

Ryzen 3がCPU 3.5GHz/3.7GHz・GPU 1.1GHz、Ryzen 5 2400GはCPU 3.6GHz/3.9GHz・GPU 1.25GHzだったので、CPU Baseを100MHz/Boostを300MHz、GPUを150MHzほど引き上げた計算になる

 それでありながら価格は149ドルや99ドルなどに抑えられており、これはこれで悪くない選択である。

性能よりも省電力性を追求したいユーザーには、Ryzen 5 3600Gはかなり良い製品になっていると思う

 インテルが14nmの歩留まりが悪すぎて、GPUなしモデルが急増している(この背景は連載508回で説明した)関係で、結果的にAMD/インテル両社ともにハイエンドモデルはGPU非統合、メインストリームの下の方~バリュー向けはGPU搭載というラインナップになっており、これもあって7nm世代のAPUが出るまでのつなぎとして投入された形だが、これはこれで悪くないと筆者は考える。

X570チップセットに
第2世代Ryzenを載せたときの挙動

 次にチップセット周りについて。連載513回の最後で、X570に第2世代Ryzenを装着した場合にどういう振る舞いになるのか、という点が不明だとしたのだが、これについて確認が取れた。

X570チップセットの構造。そういえば(B)のSATA×2は可能なのかどうか、確認し忘れた。青の枠線と(A)/(B)は筆者によるもの

 まず上の画像の(A)にあたるUSB 3.2 Gen2×4であるが、これは第2世代Ryzenを搭載した場合、USB 3.1 Gen1相当(USB 3.2 Gen1といっても良いが、要するにUSB 5Gbps相当)にダウンするとのこと。

 次いで(B)の、1×4 NVMeに関しては第2世代Ryzenでは無効になるという話であった。おそらくではあるが、第2世代RyzenのCPUピンにはそもそもこの1×4 NVMe向けのPCIeの信号が出ていないのではないかと思われる。

 またGPU接続用のx16のPCIeレーンも、X570との接続用のx4 PCIeレーンも当然Gen3相当になり、この場合X570から出るPCIeもすべてGen3相当になるという話だった。

 ただこの場合でも、チップセットから出る8ポートのUSB 3.2 Gen2ポートはそのままUSB 3.2 Gen2として有効とのことであった。これは妥当な構成なのではないかと思われる。

メモリーはDDR4-5133まで可能

 チップセットの話が出たところでついでにメモリーコントローラーの話もしておこう。第3世代Ryzenは、定格がDDR4-3200まで、という話は連載513回でレポートしたが、実際はというとDDR4-4200あたりまでは軽く行けて、DDR4-5133までは可能という説明があった。

価格性能比でのオススメはDDR4-3600だそうである

 ここに出てくる1:1Modeと2:1Modeであるが、これはメモリークロックとインフィニティーファブリックのクロック比である。

 前回の記事の図で、I/Oチップレット(cIOD)側を見ると、メモリーのクロック(memclk)とメモリーコントローラーのクロック(uclk)、それとデータファブリックのクロック(fclk)が別々のクロックソースになっていることが示されている。

前回示した図

 1:1 Modeの場合、memclkとuclkが連動し、ということはuclkとfclkも連動するために、あまりmemclkを上げすぎるとインフィニティーファブリックのスピードが上がりすぎて動作しなくなる。

 そこでDDR4-3866(つまりmemclkが1933MHz)以上の場合、uclkとfclkの比を2:1にすることで、インフィニティーファブリックの速度が上がりすぎないようにできるという話である。これを利用すれば、DDR4-5133も夢ではないというわけだ。

DDR4-5133も夢ではないのだが、ただどこのDIMMモジュールなら可能かは未公表。もっともこのスピードでは良品選別をしないと実現できない領域なので、モジュールを公開したところで確実に実現できる保証はない

Precision Boost Overdriveに
Automatic Overclock機能が追加

 オーバークロック周りで言えば、Ryzen Masterも当然第3世代Ryzenに対応したものになるが、新機能としてPrecision Boost Overdrive(PBO)にAutomatic Overclock機能が追加された。

Ryzen Masterが第3世代Ryzenに対応。ただし、これは第2世代用Ryzen Masterの画面と思われる

自動オーバークロック機能が追加。“PREMIUM MORTHERBOARD”上で、とただし書きがあるように、現実問題としてはX570と組み合わせた時のみ可能となる模様だ

 これまでよりもさらに1binか2bin、動作周波数を引き上げられるというものだが、当然その際には大電流が流れるので、マザーボード側のVRMもそれに対応したものでないと動作が不安定になるだろう。したがって、旧来のX470でこれが可能か? と言われると、原理的には不可能ではないが難しい気もする。

 ちなみに今回、Ryzen 7およびRyzen 9にはすべてCPUクーラーにWraith Prismが付属するという話になっている。通常の利用であればこれで十分であるが、ただオーバークロックの際にはやはりもう少し容量の大きなものが必要になるかもしれない。

Wraith Prismが付属。オーバークロック動作をさせないユーザーには、これで十分な性能があるので、CPUクーラーを買わずに済む分お得ともいえる

Zen 3を開発中なだけでなく
すでにZen 4もデザイン中

 CPUでは最後に遠い未来の話を。現在のZen 2に続いて7nm+を利用するZen 3を開発しているという話が出てきたが、これに続くZen 4もデザイン中であることが明らかにされた。

もちろんZen 4についての詳細は一切なし。プロセスも、5nmに行くのか6nmに行くのかあたりでやや悩んでそうである

 Zen 3は、まだテープアウトまでには時間があるだろうが、論理設計はとうに終わっている時期であり、その意味ではデザインチームが次のZen 4にかかり始めるのは理にかなっているとは言える。

NAVIはDisplay Stream Compresssion 1.2aに対応

 次はGPU側であるが、こちらはSKUと内部構造については一通り説明が終わっているので、周辺の話をいくつかしよう。

 まずはディスプレーエンジンについて。大きな特徴として、HDMI 2.0bとDisplayPort 1.4 HDRの対応に加え、Display Stream Compresssion 1.2aに対応したことが挙げられている。

HDMI 2.0bは規格としては2016年に定まっているが、主要な特徴がHLGやDolbyVisionなどの動的HDR対応(静的HDR対応はHDMI 2.0aで済んでいる)ということもあり、ソースとディスプレーの対応もなされないと意味がないところで、やっとここに来てそれらがそろい始めたともいえる

 HDMI 2.0bやDisplay Port 1.4 HDRはいいとして、説明しておく必要があるのはDisplay Stream Compression(DSC)だ。これはVESAの規格である。

 日本語ではこのDSCを「UHDディスプレーに対応した視覚的に品質劣化のない圧縮技術」などと呼ぶが、「視覚的に品質が劣化しない」というのは、「圧縮をかけてデータは劣化しているが、それを視覚的に認知できない(から問題ない)」という意味である。

 要するにDSCはLossy(元データを完全に復元できない)圧縮方式である。なぜこれが必要かというと、従来では大画面・高ビットレート・HDRの3拍子がそろうと1本のディスプレーケーブルでは帯域的に不足するからだ。そのため2本のディスプレーケーブルを利用して画面出力が必須になっていた。

 この方式そのものは、古くはDVIのDual Linkとして広く使われていたわけだが、DisplayPortやHDMIでは「電気的にはともかく見かけ上」1本のケーブルでDual Linkにするという規格が存在せず、複数本のケーブルが必要になってしまい、あまり美しい解決法とは言えなかった。

 そこで、出力画像に非可逆圧縮をかけて、1本のケーブルで送れる程度まで帯域を減らそう、というのがDSCである。理屈はともかくとして、なかなか製品には実装されなかったのだが、ここにきてNAVIではDSCをDisplay Engineに内蔵したため、今後登場するDSC対応モニターが利用できる、という話である。

E3ではASUSがDSCに対応した43インチディスプレーを発表している。もっとも発売開始時期や価格などは現時点でもまだ未公表である

 次がRadeon Media Engineで、これは動画のエンコーダー/デコーダーであるが、VP9/H.264/H.265のエンコード/デコード(VP9はデコードのみ)に対応、また8K動画のサポートも(HEVCのみだが)追加された。

このHEVCのエンコード性能改善は期待が持てそうな気がする(この部分ではこれまでNVIDIAのNVENCに水をあけられていたからだ)

AMD製GPUで使える新機能

 さて、ここからはNAVIとは直接関係ない話である。今回のNAVIにあわせてRADEON Anti-Rag、FidelityFX、Radeon Image Sharpeningといった技術が発表された。これらは必ずしもNAVIだけでなく、従来のGCNベースの製品でも利用できるものであるが、これを順に説明したい。

遅延を軽減する技術
Anti-Rag

 まずRadeon Anti-Rag。ゲームでもなんでもそうだが、まずCPU側で処理を行ない、次いでGPU側で処理して出力する。しかし、マウスやキーボードの操作はCPU側で行なうため、原理的にその操作が画面に反映されるまで、多少のラグタイムが発生する。

入力デバイスの遅延を軽減するRadeon Anti-Rag。31%の根拠は後で出てくる。またDirectX 12は基本的にサポートされないことにも注意されたい

純技術的に言えば、GPUの処理時間が限りなく0になればラグタイムもなくなるわけだが、言うまでもなくそんなことはできない

 これそのものを根絶するのは難しい。それでもCPUとGPUの処理が同期していればまだラグは一定なのだが、昨今のゲームの場合CPUよりもGPUの処理が重い(GPUは常に100%近い負荷率で、一方CPUは数十%ということも珍しくない)結果、CPU側が前倒して処理することがしばしばあり、この場合ラグがさらに広がることになる。

もちろんそんなに何十フレームもCPU側で先行処理することはないのだが、数フレーム先行することはあり得る

 そこでAnti-Ragでは、強制的にCPU側の処理をGPU側にあわせる、つまりCPU側の処理をGPU側にあわせて待機させることで、ラグを一定にするという仕組みである。

この方式は当然ながら、CPUがボトルネックになっているケースでは利用できない

 下の画像がAnti-Ragを有効にしてどれだけラグタイムが削減できるかの例で、もともとラグタイムが少ないDOTA 2 Rebornなどでは効果が薄いが、ラグタイムが大きいApex LegendsやFortniteでは効果が大きく、平均31%ほどラグタイムが削減できるとする。確かにFPS系ゲームではこの機能は有用だろう。

ラグタイムは解像度でも変わってくる。GPUがボトルネックになりやすいシーンでは当然ラグタイムが大きめになる

 ただこのAnti-Rag、大原則としてCPUとGPUの処理が交互に行なわれることが前提になっている。これはDirectX 11までのゲームでは成立するのだが、DirectX 12ではCPU側から細かく描画制御をバンバン出すようになっており、基本的に常にCPUとGPUが同期して動作しているため、原理的にAnti-Ragが効果ない。というより、外部から制御できない。その一方でGCNベースのGPUでも可能であり、したがってRyzen 2000G/3000GなどのAPUでも利用可能なものとなっている。

ゲーム向け開発ツール
FidelityFX

 次がFidelityFX。こちらはテクノロジーというよりもゲームベンダー向けの開発ツールであり、CAS(Contrast Adaptive Sharpening)を利用したポストプロセス用ツールである。どんな場面で効果的か? というのが下の画像だ。

FidelityFXは「原理的には」対応GPUを選ばない。といっても、当面はNAVI/GCN向けということになる

Tom Clancy's The Division 2でのFidelityFX適用例

 具体的には、路面の表現や壁のハニカム模様、あるいは人間の表現などに効果があるとしている。すでに多くのゲームスタジオが興味を持っている、という話であった。

おそらくF1 2019の画面と思われる。FidelityFXを利用することで、のっぺりした路面の表現が若干リアルになっている

こちらもF1 2019のものと思われる。ただ、ここでハニカムをきちんと表現することがゲーム性にどこまで影響するかは謎

こちらはUnity Engineに組み込まれた例

どこまで採用されるかはまた別の話

画像を鮮明にする
FidelityFX

 次がRadeon Image Sharpeningで、画面をシャープにしつつ、性能へのインパクトがほとんどないとされる。

一応左右で見比べると、岩の模様などのシャープさが改善されているのがわかる

フレームレートへの影響は1%程度なので、実質的に問題がない、というのがAMDの主張

 これはNVIDIAのDLSSへの対抗技術である。DLSSの詳細はGeForce RTX 20シリーズの解説記事で説明されているが、要するにDeep Learningベースのフィルタリングであるが、原理上Tensorコアを搭載していないと利用できず、またゲーム側がDLSSに対応する必要がある。

 Radeon Image Sharpeningはゲーム側の対応の必要がなく、またNAVIでそのまま利用できるという点をアピールしたいようだ。

 ということでCPUとGPUで漏れていた説明を一通りさせていただいた。AMDはほかにさまざまなベンチマークレポートも示したが、来週には実際に第3世代RyzenやRadeon RX 5700シリーズが発売されるわけで、実機を利用した性能評価をご覧になりたいだろうと思い、今回は割愛した。

 発売開始と同時に掲載されるであろうベンチマークレポート(おそらく加藤勝明氏が今必死に作成されているものと思われる)をお待ちいただきたい。

■関連記事