AVX-512 Unitを搭載しないことが判明
性能重視のP-Core
さて前回は軽く流したが、P-Coreの拡充ぶりはすごい。P-Coreの全体構造は前回示したが、それ以前のWillow Cove(Tiger Lakeに使われているコア:Rocket LakeのCypress Coveの次世代にあたる)と比較したのが下の画像である。フロントエンド、つまりスケジューラーまではまだしも、Issue Portの数が大幅に増えているのがわかる。
まずフロントエンドだが、Sunny Cove&Willow Cove/Golden Coveでは以下のようにデコード性能が大幅に強化されている。
デコード性能 | ||||||
---|---|---|---|---|---|---|
開発コード名 | デコード | μOpキャッシュ | マイクロコード | |||
Sunny&Willow Cove | 5命令/サイクル | 6μOp/サイクル | 4命令/サイクル | |||
Golden Cove | 6命令/サイクル | 8μOp/サイクル | 4命令/サイクル |
さらにμOpキャッシュ容量やキューなど、すべてが強化されている。μOpキャッシュからはついに8μOp/サイクルでの供給になっており、キャッシュ容量の増加と相まって実効デコード性能を大幅に引き上げているように見える。
一方、バックエンドの方であるが、まずIssue Portが10→12に強化された。またアロケーションも同時6命令に強化されている。
そして増強であるが、まず5番目のALUが追加されたことで、通常のアプリケーションであってもついにx86命令換算で5命令/サイクルの実行が可能になった。
またFPU系で言えば、新たにFast Adder(FADD)が2つ追加されている。そしてALUが5つということは、メモリーアクセスをともなうALU命令が5命令/サイクルで実行される可能性があるわけで、これに対応してAGU(Address Generation Unit)も5つに強化された。
2次キャッシュはWillow Coveの1.25MBを継承したが、これもサーバー(つまりSapphire Rapids)向けでは2MBに増強されることになっている。
ところで、クライアント向け(つまりAlder Lake)のP-CoreではAVX-512とAMXが利用できない。これはP-CoreとE-Coreで利用できる命令セットが完全に一致していないとスレッドの切り替えができないためだ。
このうちAMXはアクセラレーターなので搭載されていないのは間違いないとしてAVX-512は? という話だが、これは「無効化されている」のか「搭載されていない」のかに関しては、どうも搭載されていない公算が高そうだ。
HotChipsの質疑応答で、AVX-512 Unitは搭載されていないのか、それとも無効化されているのか? という質問に対し、説明したインテルのEfraim Rotem氏は「両方だ。Golden Coveのいくつかの機能はクライアント向けでは無効化され、いくつかは物理的に削除されている」と回答し、間接的にであるがAVX-512は搭載されていないことを示唆している。
そもそもSapphire RapidsとAlder Lakeは2次キャッシュのサイズが違うから、コアそのものが異なっている。またAVX-512ユニットは物理的にそれなりのサイズを占有するので、コストが厳しいクライアント向けに搭載する理由はない(し、外すのも簡単である)。無効化されている機能は、RAS関係などパイプライン内部にがっちり組み込まれており、外すのが困難な機能だろうと想像される。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ