8コア16スレッドのIntel 「Broadwell-E」の性能を上回る
一方省電力に関しては、従来の28nm SPPから14nm LPPに切り替えたことでより省電力動作が可能になっているが、これに加えていくつかの工夫によって更に省電力化を進めたとしている。もう少し細かく説明しよう。
Clock Gatingは不要なブロックのクロック供給を止めて待機状態にする(ことで消費電力を下げる)仕組みで、これを複数レベルのRegionで実施しているとする。おそらくは(不要ブロックの電源供給をもカットする)Power Gatingも複数レベルで実装されているだろう。
またμOp-Cacheを搭載したことで、ここにヒットしている間はデコードを止められる。昨今のプロセッサーの場合、ユニット単位で言えば間違いなくデコードが一番電力を喰っているので、これを止められる効果は大きい。
Stack EngineはK10世代のSideband Stack Optimizerと同じものなのか、あるいは例えばBranch Predictionとなにか連携するような仕組みなのかは不明だが、いずれにせよなにかしら実装がなされているようだ。
Sideband Stack Optimizerと同じだとすれば、スタックの操作の際にALUを動かさずに専用回路で処理することで消費電力を減らせる(ついでにALUを空けられる)というメリットがあり、主に省電力に効果的である。
次のMove eliminationは、Mov命令(データを指定の領域あるいはレジスターにコピーする)を愚直に実行するのではなく、Register Renamingの段階で実施してしまう方法だ。これはある意味古典的な技法であるが、ALUを動かさずにRenamingの段階で処理が終るので、やはり省電力に効果的である。
ちなみに今回のスライドにはなかったが、AMDはBristol Ridgeの世代でAVFS(Adaptive Voltage Frequency Scaling)や信頼性トラッキング、BTC(Boot Time power supply Calibration)といった消費電力最適化技法を導入している。
さらにZenと同じく14LPPを利用するPolarisではこれに加えてMBFF(Multi-bit flip-flop)というテクニックを採用して省電力化を進めている。おそらくはこうした技法も当然Zenに搭載されていると思われる。
こうした工夫の結果、Zenコアは消費電力はExcavatorコアと同等のまま、IPCを40%程度改善できた、としている。
この「Excavatorと同レベル」というのは、なにもしなくてもモバイル向けのPower Profileを実現可能という意味で、当初はデスクトップ、次いでサーバーになるが、モバイルにも十分入れられる実力はあることになる。
またZenに続き、Zen+が投入されることも明らかにされた。Zen+の投入はおそらく2017年末~2018年になるであろう。
ちなみに性能であるが、発表会では3GHz駆動で8コア/16スレッドのSummit Ridgeのエンジニアサンプルと、同じく3GHz駆動で8コア/16スレッドのBroadwell-Eを並べ、BlenderのCPU Rendering性能を比較するというデモを実施している。下の動画の1:30あたりからがそれだ。
これだけで性能云々を語るには情報が少なすぎるのだが、比較的良い勝負になるとAMDが考えていることは明らかになった。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ

