明らかにされた情報から、Bulldozerの姿を読み解く
年末年始スペシャルの最後は、いよいよAMDの次世代コア「Bulldozer」「Bobcat」である。2009年11月に開かれた「Financial Analyst Day」でBulldozerの詳細が発表された直後から、いろいろな議論がネット界隈で駆け巡った。
![]() | Financial Analyst Dayで公開されたBulldozerの概要 |
|---|
まずAMDが公開した話をまとめると以下のようになる。
- 2つのスレッドを同時に実行できるが、SMT(Symmetric Multi-Threading)とは異なり、整数実行ユニットはスレッド間で共用されない。
- 整数演算は4命令のアウトオブオーダー。また2ロード/サイクルをスレッドごとに実現する。
- 浮動小数点演算は2スレッドで実行ユニットを共用する。
- FMAC4 & CVT16をサポートする。
問題はこの「4命令のアウトオブオーダー」の解釈である。当初、筆者はBulldozerはスレッドごとに4つの「ALU+AGU(ロード/ストアユニット)パイプ」を持つと理解した。後述するBobcatのプレゼンテーションが、ALUとロード/ストアで実行ユニットの表記を変えているのに対し、Bulldozerではスレッドごとに4つの「パイプライン」が並んでおり、これは均質なものに見えたからだ。
また、K6世代の2命令/サイクルから、K7→K8→K10と3命令/サイクルを狙ったアーキテクチャーを3世代にわたって改良してきているので、「次は4命令/サイクルを狙っても不思議ではない」と考えていた。しかも、ローエンドのBobcatが2命令/サイクルのアーキテクチャーで出てきており、K10と合わせれば2/3/4命令/サイクルのアーキテクチャーが揃う形になる。
ところが、これに関しては日本AMD経由で米AMDより、明確に「スレッドあたりALUが2つ、AGUが2つの合計4つである」という回答が帰ってきた。つまりIPC(命令/サイクル数)的にはちょっと逆戻りした感がある。だが、もう少し上の回答を突っ込んで考えると、もう少し深い狙いがある事が見えてきた。
この連載の記事
- 第111回 アーキテクチャーから予測するBulldozerコアの性能
- 第110回 バスの歴史を振り返る PCI Expressと関連規格を総ざらえ
- 第109回 バスの歴史を振り返る PCIからAGP、PCI-X編
- 第108回 LlanoからTrinityへ 2011~2012年のAMD CPU
- 第107回 バスの歴史を振り返る EISA~VL Bus編
- 第106回 バスの歴史を振り返る XT Bus~ISA Bus編
- 第105回 IBM PC BusからPCI Expressまで PC用拡張バスの歴史
- 第104回 Mobile RAMからWideIOへ モバイル向けメモリーの進化
- 第103回 PS3で初採用 次世代GPU用メモリーも狙うXDR DRAM
- 第102回 グラフィック専用メモリーの進化と不透明な今後
- この連載の一覧へ
















