Zenの内部構造を予想
下図は、連載332回で紹介した内部構造図のアップデートである。
デコード段のFast PathとVector Pathは、図が複雑になるだけなのでまとめてしまった。またRegister Fileは省略している。
現段階で不明なのは、Micro-op Queueの実態である。上では「要するにDispatch Unit」であると書いたが、そして実際ディスパッチの機能は持っているが、それ以外にデコードされたx86命令をMicro-opに変換するのもこのステージである。
ここではMicro-op Queueと1つのブロックにからめたが、内部的には連載332回で示したように2段階になっており、最初のステージではx86からデコードされた中間命令をμOpに変換する作業、2つ目のステージが変換されたμOpをディスパッチする処理で、この2つのステージの間にバッファが入る、という構造ではないかと思う。
そしてMicro-opキャッシュはコンバート後のMicroOpを、おそらく数KOps保持する構造と思われる。構造的にMicro-opキャッシュが効果を上げるのは、プログラムのループ構造を丸ごと保持するようなケースである。
数百Opsでは、やや複雑なループであふれてしまうし、数十KOpsでは1次キャッシュより大きくなってしまいかねないため、根拠のない直感で言えば2~4KOpsあたりではないかと予想する。
不明なのは他にもあって、Summit Ridgeは8コア構成だが、このコア同士がどう接続されるかが現時点でははっきりしない。Bulldozer世代では4モジュール/8コアをファブリックで接続し、このファブリックに3次キャッシュも接続されるという構成だったが、この方式を踏襲するかどうかは不明である。
ただ、こうした事柄はまもなく開催されるHotChipsでもう少し詳細が明らかにされることを期待したいところだ。
Socket AM4用のチップセット開発が難航?
以上が公式に発表された情報を基にした話であるが、以下では非公式情報を若干お届けしよう。まずは動作周波数であるが、今回のデモで3GHz駆動は問題なくできることが示されている。実際の動作周波数はBase 2.8GHz/Turbo Core動作時3.2GHzといったスペックになりそうである。
そしてその際のTDPは、4コア/8スレッド品が65W、8コア/16スレッド品が95Wという数字はほぼ確定のようだ。連載333回で、3GHz程度の動作周波数でTDPが60W程度と推定したが、おおむね合致したようでほっとしている。
Summit Ridgeそのものは順調に推移しているようだが、これをサポートするはずのSocket AM4プラットフォームがさっぱり出てこないのが現時点での問題である。
実際Socket AM4を普及させるための露払いの役目をBristol Ridgeが担うことになっていたはずなのだが、これが出ないのはBristol Ridgeの問題ではなく、Socket AM4用のチップセットに問題がある、という話が出ている。
詳細は明らかでないが、USB向けにReTimerチップが必要なんて話があるあたり、「またか」という気になる(連載203回参照)。
ReTimer、という用語はPCI Expressのものであるが、単純に言えば信号のリピーターである。USBは3.0以降でPCI Expressの規格を利用している(3.1では物理層は独自になったが、その上は引き続きPCI Expressをベースにしている)のだが、PCI Expressでは特に信号速度が上がった場合には通信できる距離が限られる。
これは伝達時間の問題ではなく、距離が伸びると信号が急速に劣化してまともに通信できなくなるという話である。
ただ通信できる/できないを判断するのは、最終的に「所定の時間内に定められた信号が来るかどうか」で判断するわけで、そのためにPCI Expressデバイスは内部に一種のタイマーを持っており、ここでタイムアウトが発生すると通信失敗と判断するわけだ。
そこである程度の距離を伸ばす場合、間にリピーターを挟んで信号品質を改善するわけだが、この際にリピーターを挟むタイミングでタイマーを一度0クリアして時間を数え直すことになる。この「タイマーをクリアして数え直し」という動作からReTimerという呼び方がなされている。
話を戻すと、Socket AM4では基本的にUSB 3.1のコントローラー(xHCI)そのものはCPU側に入っており、ここから信号をチップセット側に引っ張り出してマザーボード上のコネクターにつなぐ、という形での実装を考えていたらしい。
しかし、この方式では配線長が限界を超えてしまうのか、他になにか信号が劣化する要因があったか判断できないが、とにかくReTimerを挟まないと通信できないという問題が出ており、この対処に手間取っているという話であった。
このあたりをどう解決されるのかはまだはっきりしないが、これが理由でSocket AM4自身が出てくるのはほとんどZenと同じタイミングという可能性も出てきたのは、デスクトップ向けのBristol Ridgeがスキップされるという意味でもあって残念である。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ

