実態は6ポートの実行ユニットだが、
効率面では5ポート相当?
「Register Alias Table」(RAT)から先がアウトオブオーダー部になる。RATや「Re-order Buffer」(ROB)、「Ready/Schedule」(Rdy/Sch)の構成そのものは変わらないが、同時に送り出すμOpの数は、Yonahまで3μOps/サイクルだったのに対して、Meromでは4μOps/サイクルに強化されている。
また、各ステージで保持されるμOpsの数も大幅に強化されている。YonahではROBのサイズが40エントリ以上(48?)、Rdy/Schのサイズが24エントリだったのに対し、Meromではそれぞれ96エントリ、32エントリに増強されている。同時に処理できる命令数が増えた分、バッファも大きめにしないと「次に処理すべき命令がない」という状況に陥りやすいため、これを防止するための方策と考えればいい。
実行ユニットも面白い構成になっている。前回では、Yonahの実行ユニットが6ポート(うちALUに3ポート)の構成であるのに対して、Meromや続く「Penryn」の実行ユニットは5ポート(ALUは3ポートのまま)に減らされていると書いた。この構成にはもちろん、それなりに理由があってのことだ。
「Intel Core Microarchitecture Pipeline Overview」というマニュアルを見ると、ALU/FPU/MMX/SSEの実行ユニットが3ポート、Load/Storeが各1ポートで、合計5ポートに減ったかのように描かれている。これを見ると一見、Dispatchユニットが5ポートに減らされたかのように見える。
ところが、同じマニュアルの「Issue Ports and Execution Units」にある図では、Port 0/1/5がALU/FPU/SIMD向けで、LoadがPort 2、Store AddressがPort 3、Store dataがPort 4に割り当てられていると描かれている。
つまり、先の図でDispatchユニットが5ポートに見えるのは、図が簡略化されているだけで、実際には6ポート相当の構成である。そこを5ポートとしたのは、インテル自身が「物理的には6ポートだが、Store addressとStore dataは独立して動くケースが少ないので実質5ポート相当」と判断している……ように思われる。この話は、次回の「Nehalem」の際に、もう一度説明しよう。
部分的に止まった
Meromでの64bit対応
2点目の改良点は、64bitモード「EM64Tへの対応」である。Pentium 4世代の「Prescott」で初めて実装されたEM64Tだが、一種のマイクロコードによるデコードだったおかげで、ファームウェアの書き換えで簡単に実装できた(関連記事)。
しかし、マイクロコードの利用を最小限に抑えていたYonahでは、デコード段の開発をやり直すことになるため、出荷時期から逆算すると対応させるのは間に合わない。結局EM64Tへの対応は、Meromまで実現できなかった。Meromの世代でもEM64Tを完璧に実装できたとは言いがたい。一部をマイクロコードに頼って動作をさせており、このあたりが完璧になるのはNehalemまでお預けとなった。
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ