年末年始特別編3
2011年の新CPUコア「Bulldozer」「Bobcat」の姿
2010年01月11日 12時00分更新
明らかにされた情報から、Bulldozerの姿を読み解く
年末年始スペシャルの最後は、いよいよAMDの次世代コア「Bulldozer」「Bobcat」である。2009年11月に開かれた「Financial Analyst Day」でBulldozerの詳細が発表された直後から、いろいろな議論がネット界隈で駆け巡った。
まずAMDが公開した話をまとめると以下のようになる。
- 2つのスレッドを同時に実行できるが、SMT(Symmetric Multi-Threading)とは異なり、整数実行ユニットはスレッド間で共用されない。
- 整数演算は4命令のアウトオブオーダー。また2ロード/サイクルをスレッドごとに実現する。
- 浮動小数点演算は2スレッドで実行ユニットを共用する。
- FMAC4 & CVT16をサポートする。
問題はこの「4命令のアウトオブオーダー」の解釈である。当初、筆者はBulldozerはスレッドごとに4つの「ALU+AGU(ロード/ストアユニット)パイプ」を持つと理解した。後述するBobcatのプレゼンテーションが、ALUとロード/ストアで実行ユニットの表記を変えているのに対し、Bulldozerではスレッドごとに4つの「パイプライン」が並んでおり、これは均質なものに見えたからだ。
また、K6世代の2命令/サイクルから、K7→K8→K10と3命令/サイクルを狙ったアーキテクチャーを3世代にわたって改良してきているので、「次は4命令/サイクルを狙っても不思議ではない」と考えていた。しかも、ローエンドのBobcatが2命令/サイクルのアーキテクチャーで出てきており、K10と合わせれば2/3/4命令/サイクルのアーキテクチャーが揃う形になる。
ところが、これに関しては日本AMD経由で米AMDより、明確に「スレッドあたりALUが2つ、AGUが2つの合計4つである」という回答が帰ってきた。つまりIPC(命令/サイクル数)的にはちょっと逆戻りした感がある。だが、もう少し上の回答を突っ込んで考えると、もう少し深い狙いがある事が見えてきた。
この連載の記事
-
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ