AVX-512 Unitを搭載しないことが判明
性能重視のP-Core
さて前回は軽く流したが、P-Coreの拡充ぶりはすごい。P-Coreの全体構造は前回示したが、それ以前のWillow Cove(Tiger Lakeに使われているコア:Rocket LakeのCypress Coveの次世代にあたる)と比較したのが下の画像である。フロントエンド、つまりスケジューラーまではまだしも、Issue Portの数が大幅に増えているのがわかる。
まずフロントエンドだが、Sunny Cove&Willow Cove/Golden Coveでは以下のようにデコード性能が大幅に強化されている。
デコード性能 | ||||||
---|---|---|---|---|---|---|
開発コード名 | デコード | μOpキャッシュ | マイクロコード | |||
Sunny&Willow Cove | 5命令/サイクル | 6μOp/サイクル | 4命令/サイクル | |||
Golden Cove | 6命令/サイクル | 8μOp/サイクル | 4命令/サイクル |
さらにμOpキャッシュ容量やキューなど、すべてが強化されている。μOpキャッシュからはついに8μOp/サイクルでの供給になっており、キャッシュ容量の増加と相まって実効デコード性能を大幅に引き上げているように見える。
一方、バックエンドの方であるが、まずIssue Portが10→12に強化された。またアロケーションも同時6命令に強化されている。
そして増強であるが、まず5番目のALUが追加されたことで、通常のアプリケーションであってもついにx86命令換算で5命令/サイクルの実行が可能になった。
またFPU系で言えば、新たにFast Adder(FADD)が2つ追加されている。そしてALUが5つということは、メモリーアクセスをともなうALU命令が5命令/サイクルで実行される可能性があるわけで、これに対応してAGU(Address Generation Unit)も5つに強化された。
2次キャッシュはWillow Coveの1.25MBを継承したが、これもサーバー(つまりSapphire Rapids)向けでは2MBに増強されることになっている。
ところで、クライアント向け(つまりAlder Lake)のP-CoreではAVX-512とAMXが利用できない。これはP-CoreとE-Coreで利用できる命令セットが完全に一致していないとスレッドの切り替えができないためだ。
このうちAMXはアクセラレーターなので搭載されていないのは間違いないとしてAVX-512は? という話だが、これは「無効化されている」のか「搭載されていない」のかに関しては、どうも搭載されていない公算が高そうだ。
HotChipsの質疑応答で、AVX-512 Unitは搭載されていないのか、それとも無効化されているのか? という質問に対し、説明したインテルのEfraim Rotem氏は「両方だ。Golden Coveのいくつかの機能はクライアント向けでは無効化され、いくつかは物理的に削除されている」と回答し、間接的にであるがAVX-512は搭載されていないことを示唆している。
そもそもSapphire RapidsとAlder Lakeは2次キャッシュのサイズが違うから、コアそのものが異なっている。またAVX-512ユニットは物理的にそれなりのサイズを占有するので、コストが厳しいクライアント向けに搭載する理由はない(し、外すのも簡単である)。無効化されている機能は、RAS関係などパイプライン内部にがっちり組み込まれており、外すのが困難な機能だろうと想像される。
この連載の記事
-
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ - この連載の一覧へ