Ryzen 5000シリーズはなぜ高速なのか？秘密はZen 3の内部構造にあり　AMD CPUロードマップ

2020年11月09日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

スケジューラーの構造を大きく変更した
バックエンド

　次がバックエンドである。先にも書いたが、Integer(整数演算)が最大8イシュー、Float(浮動小数点演算)が最大6イシューとなり、その意味ではどちらも同時実行命令数は増えてはいるのだが、やや筆者の予想と異なる最適化の方向性になっていた。

バックエンドの構成。スケジューラーの構造変更が最大のポイントかもしれない

　このレベルでの最大の相違点はスケジューラーの変更だ。Zen/Zen 2は、AGUとALUを別々に扱うという仕組みで、であれば7つの発行ポート全体をカバーするスケジューラーにした方が効率が良いという判断であった。この発想はインテルとかなり近い。これに対してZen 3では以下の4つに分解されることになった。

Zen 3のスケジューラー
Scheduler 0	ALU0+AGU0
Scheduler 1	ALU1+AGU1
Scheduler 2	ALU2+AGU2
Scheduler 3	ALU3+BRU1

　これはなぜかと言えば、おそらくだが実際に実行中のプロファイルを取ってみると、予想以上にメモリー演算が多かったのだろう。そもそもRISCの場合、演算命令はレジスターに対して行なう形で、メモリーアクセスが可能なのはロード/ストアー命令に限られている。だからこそAGUとALUは別々に動かしても問題ないという発想である。

　これはx86も同じで、x86なりx64そのものはCISCであるが、Micro-Opに変換した段階でRISC風になっているため、ALU命令そのものはすべて内部のレジスターに対して行なう形となり、これとは別にメモリーからレジスターへのロード命令が自動的に生成される形になる(ストアーに関しては原則として、x86/x64でも明示的に命令を発行する必要がある)。

　ただ、そうした「メモリーからのロード+演算」の組み合わせが少なければ、ALUとAGUを別々に駆動しても問題ないのだが、その頻度があまり多いようだと、ALUとAGUがペアになって動く方が効率が良いことになる。

　そもそも、先のフェッチ/デコード段の概要を説明する画像で、Dispatchから出てくるのは「Macro-Ops」であることに注意されたい。これはインテルの言うMacro-Opsと同じもので、要するに複数のMicro-Opsの組み合わせである。要するにフェッチの段階では

x86

ADD reg, Mem

メモリー上の値を加算するx86のADD命令

　だったのがデコードの後では

Micro-Op	load Mem, reg1	reg1にMemの内容をloadするMicro Op
Micro-Op	add reg, reg1	regにreg1の内容を加算するMicro Op

　に変化し、これがDispatchを出るときには、以下のようにまとめられるわけだ。

Micro-Op

load&add reg, reg1, Mem

上の2つのMicro OpをまとめたMacro Op

　今まではスケジューラーの中で、このMacro-Opをもう一度ほぐしてALUとAGUに命令を投入していた形だが、そうであれば最初からほぐさずにスケジューラーでは1つのMacro Opとしてスケジューリングを行ない、それを発行する段階で2つに分離した方が効率が良いと判断されたようだ。このあたりはK7→K8の構造の推移に非常に近い。

　下の画像は10 issue per cycleとあるが、これはStore Data×2が図には入っていないためだ。

整数演算の仕組み。AVX命令を実行しながら並行してレジスターの内容の保存が可能になった。したがって、スループットは0.5だったのが1になったことになる

　実際にはStore Dataの作業はロード/ストアーユニット側なのでここに計上するのは間違っているのかもしれないが、整数演算系で1サイクルあたり2つのストアーが可能(従来は1つ)というのは、特にメモリーに書き出しが多いアプリケーションでは性能向上につながることになる。

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

AMD記事アクセスランキング

お勧めのAMD記事

sponsored
2026年03月07日更新

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する
sponsored
2026年02月19日更新

今買うべきAMD Ryzen 7 9850X3D搭載BTOパソコンおすすめ8選！
自作PC
2026年01月28日更新

「Ryzen 7 9850X3D」速攻検証：クロックが400MHz上がった以上の価値を見いだせるか？
デジタル
2026年01月19日更新

組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現
デジタル
2026年01月12日更新

CES 2026で実機を披露！ AMDが発表した最先端AIラックHeliosの最新仕様を独自解説

AMD

Ryzen 5000シリーズはなぜ高速なのか？秘密はZen 3の内部構造にあり　AMD CPUロードマップ

スケジューラーの構造を大きく変更した
バックエンド

この連載の記事

デジタル
AMDが“究極のワークステーション向けプロセッサー”と表する「Ryzen Threadripper Pro 5000 WXシリーズ」の気になるポイントを解説

デジタル
Ryzen 5000シリーズの性能をさらに引き上げる「Precision Boost Overdrive 2」は12月に登場

デジタル
性能/消費電力比がCore i9の2.8倍というRyzen 5000シリーズの詳細　AMD CPUロードマップ

デジタル
判明した第3世代Ryzenの内部構造を大解説　AMD CPUロードマップ

PC
ロードマップでわかる！当世プロセッサー事情（目次）

AMD記事アクセスランキング

お勧めのAMD記事

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する

今買うべきAMD Ryzen 7 9850X3D搭載BTOパソコンおすすめ8選！

「Ryzen 7 9850X3D」速攻検証：クロックが400MHz上がった以上の価値を見いだせるか？

組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現

CES 2026で実機を披露！ AMDが発表した最先端AIラックHeliosの最新仕様を独自解説

Sponsored Articles

西日本最大のPC市場、大阪日本橋で売れ筋のAMD系PCパーツを大調査！

プロフェッショナルへ捧ぐ“怪物”―AMD Ryzen Threadripper 9000シリーズ搭載PC、国内BTOメーカーから一挙集結

AMDならこれが買い！ PCパーツメーカーが選ぶオススメ3選～ASUS編～

AMDならこれが買い！ PCパーツメーカーが選ぶオススメ3選～MSI編～

Ryzen 5000シリーズはなぜ高速なのか？ 秘密はZen 3の内部構造にあり AMD CPUロードマップ

スケジューラーの構造を大きく変更した バックエンド

この連載の記事

この記事の編集者は以下の記事をオススメしています

デジタル AMDが“究極のワークステーション向けプロセッサー”と表する「Ryzen Threadripper Pro 5000 WXシリーズ」の気になるポイントを解説

デジタル Ryzen 5000シリーズの性能をさらに引き上げる「Precision Boost Overdrive 2」は12月に登場

デジタル 性能/消費電力比がCore i9の2.8倍というRyzen 5000シリーズの詳細 AMD CPUロードマップ

デジタル 判明した第3世代Ryzenの内部構造を大解説 AMD CPUロードマップ

PC ロードマップでわかる！当世プロセッサー事情（目次）

AMD記事アクセスランキング

お勧めのAMD記事

Sponsored Articles

Ryzen 5000シリーズはなぜ高速なのか？秘密はZen 3の内部構造にあり　AMD CPUロードマップ

スケジューラーの構造を大きく変更した
バックエンド

デジタル
AMDが“究極のワークステーション向けプロセッサー”と表する「Ryzen Threadripper Pro 5000 WXシリーズ」の気になるポイントを解説

デジタル
Ryzen 5000シリーズの性能をさらに引き上げる「Precision Boost Overdrive 2」は12月に登場

デジタル
性能/消費電力比がCore i9の2.8倍というRyzen 5000シリーズの詳細　AMD CPUロードマップ

デジタル
判明した第3世代Ryzenの内部構造を大解説　AMD CPUロードマップ

PC
ロードマップでわかる！当世プロセッサー事情（目次）