Zenのクロックは3GHzと予想
2016年のComputexで公開か?
最後がAGUである。AVX命令の場合が一番クリティカルなのでこのケースで考えてみる。FMAC、つまり乗加算を同時に行なう以下のような演算をAVXで実行する場合だ。
Y=A×X+B
AとBが定数ならば、単にXを読み込んでYを書き出すだけで済むので、1サイクルあたり256ビット=32バイトというわけで、32バイト/サイクルのロードとストアーが同時に行なえれば理論上は間に合う。
もちろん、同じFMACでも例えば以下のように、XとYを読み込んでZを書き出すケースだとこれでは不足する。
Z=X×Y+B
インテルがHaswellでロードユニット×2+ストアーユニット×1という重厚な構成にした(関連リンク)のは、こうしたケースでもキャッシュへの帯域がボトルネックにならないようにという配慮である。
ただ先に書いたとおりAGUは2つしかないので、これを実現しようとするとAGUの帯域を64バイト/サイクルに増やさないとマッチしないことになるが、さすがにこれは考えにくい。現実問題としてそのあたりは割り切ったのだろうと想像される。
今回の推定図は、あくまでもZen用のパッチコメントからの情報と、Waldhauer氏との議論で出てきた内容を元に筆者が予想しているものなので、これが正確かどうかはフタをあけてみないと判断できない。
Waldhauer氏は、他にAMDの取得した特許情報などを元に自身の推定を補強しているが、筆者はそのあたりは今回採用していない。
いずれにせよ、すでにAMDはK12とZenをテープアウトしたことを第4四半期の電話会議で発表しており、製造に問題がなければ2016年のCOMPUTEXあたりのタイミングで動作するシリコンがお目見えするかもしれない。
最後に、Waldhauer氏は動作周波数として3.5~4GHzという数字を挙げておられるが、筆者はもう少し控えめな数字(~3GHz程度)ではないかと予想する。
これは利用すると思われるGlobalFoundriesの14nm LPE(LPPが間に合うかはタイミング的に微妙)、あるいはTSMCの16nm FinFET+が、3GHzを超えるとさすがに消費電力がバカにならないからだ。性能/電力比を重視すると、どうしてもプロセスに関してもあまり攻めた設定はしにくい。
そもそもTSMCにしてもGlobalFoundries(というよりSamsung)にしても、現在提供しているFinFETプロセスはいずれもモバイルSoC向けを主眼に置いたもので、ターゲットはせいぜい2.5GHz程度で、がんばっても3GHzというあたりだ。
下の画像は2014年のARM TechConにおけるTSMCの資料だが、だいたい2GHzあたりから消費電力が急増しており、おそらく3GHzでCortex-A57を動作させると2Wでは効かないだろうし、4GHzあたりは想像もできない。
Cortex-A57が1コアでこれなので、Zenクラスを4GHzで動かすのは無理だと思われる。このあたりの事情はGlobalFoundriesもほとんど同じである。したがって筆者は最大で3GHzという予測を立てている。

この連載の記事
-
第855回
PC
配線太さがジュース缶並み!? 800V DC供給で電力損失7~10%削減を可能にする次世代データセンターラック技術 -
第854回
PC
巨大ラジエーターで熱管理! NVIDIA GB200/300搭載NVL72ラックがもたらす次世代AIインフラの全貌 -
第853回
PC
7つのカメラと高度な6DOF・Depthセンサー搭載、Meta Orionが切り開く没入感抜群の新ARスマートグラス技術 -
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 - この連載の一覧へ











