年末年始特別編3
2011年の新CPUコア「Bulldozer」「Bobcat」の姿
2010年01月11日 12時00分更新
Bulldozerの設計方針を探る 鍵はトランジスター技術とコストか
ではなぜAMDはそんな変更をしたのか? ひとつにはAMDのダイサイズが、同時期のインテルCPUのダイサイズに比較して大きいということが挙げられる。その理由の半分は、プロセス微細化でインテルが先行していることが挙げられる。
以下の写真は、左からPropus(Athlon II X4)、Nehalem、Penrynのダイ写真である。赤または青で薄くマスクされている部分は、1コア分のサイズを示す。
発表されているそれぞれのダイサイズと、写真から換算した1コアあたりのダイサイズは、以下のようになる。ただし、Nehalemは各コアに256KBの2次キャッシュを含んでいることに注意。Propus/Penrynでは、各コアは1次キャッシュのみ。
- Propus(K10) 169mm2/約16.6mm2
- Nehalem 258mm2/約27.3mm2
- Penryn 107.6mm2/約25.6mm2
同じ45nmプロセスでそろえると、K10のコアはそれほど大きくない。ところが、実際にはインテルが1年ほどプロセス微細化で先行しているので、実際にはAMDのダイは2倍相当と見なさなくてはならないことになる(インテルはすでに32nmのWestmereの投入を開始している)。
もうひとつ無視できないのは、スレッドの数である。Penrynはともかく、Nehalemはハイパースレッディングテクノロジーを使うことで、2スレッド実行を27.3mm2のコアで実現しているが、Propusはあくまで1スレッドである。このあたりを勘案すると、ダイサイズをもう少し削らないとインテルとの価格面での遅れが縮まらない。ダイサイズの大きさはそのまま消費電力の多さにもつながる(静的なリーク電流はトランジスター数に比例して大きくなるので、「トランジスター数の多さが消費電力増大につながる」というのが正確な言い方だろう)。もう少し設計を効率化しないといけない。
こうした観点から言うと、常時動いているとは限らない「ALU+AGU」のペアを3組も抱えているよりも、独立して動く「ALU×2」と「AGU×2」の方が、消費電力的にもダイサイズ的にも効果的であると判断したと思われる。
FPUは2スレッドで1基を共有
Bulldozerのもうひとつの特徴が、浮動小数点演算ユニット(FPU)を2スレッドで共用するという仕組みだ。ごく一部、つまり「ハイパフォーマンスコンピューティング分野」(HPC)に代表されるような用途を除くと、FPUが激しく動くというケースはあまりない。強いて言えばエンコーダーなどで複数ストリームを同時エンコードするケースだろうか。利用頻度は非常に少ないといえるが、だからと言って互換性のためには削るわけにもいかない。
そこでFPUをスレッド間で共用にすることでトランジスターを節約しよう、という発想である。Bulldozerの世代では、インテルの新しい拡張命令「AVX」と互換性のある「FMA4 and CVT16」が搭載されるという話はすでに紹介した(関連記事)。構成を見ると、FPUに実行ユニットが2つ用意されているあたり、恐らくそれぞれがFPUやSSEをサポートした128bitの演算ユニットで、「FMA4 and CVT16」の実行時は、2つのユニットが共同で動くことで256bit演算を行なうと想像される。
ここでちょっとポイントになるのは、「BulldozerではFPU/SSE/AVXレジスターがどこに置かれるか」である。2つのスレッドがどちらもSSE/AVX演算を行なうケースは当然ありえるから、各整数演算ユニット側にそれぞれFPU/SSE/AVXレジスターが置かれ、FPUがこれにアクセスする形になると思われる。そのため、SSE/AVX演算などに関しては、従来のK10までに比べて遅延が多少長くなる可能性はありそうだ。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第879回
PC
なぜAIには「光」が必要なのか? NVIDIAが解説するスケールアップネットワークの低遅延・省電力化戦略 -
第878回
PC
もはや銅配線は限界? 3200Gイーサネット実現に立ちはだかる200GT/秒の壁 -
第877回
PC
「不良品ゼロ」と「水冷NG」の狭間で。ルネサスが明かした車載チップレットSoCのリアル -
第876回
PC
このままではメモリーが燃える! HBM4/5世代に向けた電力供給の限界と、Samsungが示すパッケージ協調設計の解 -
第875回
PC
1000A超のAIプロセッサーをどう動かすか? Googleが実践する垂直給電(VPD)の最前線 -
第874回
PC
AIの未来は「電力」で決まる? 巨大GPUを支える裏面給電とパッケージ革命 -
第873回
PC
「銅配線はまだ重要か? 答えはYesだ」 NVIDIA CEOジェンスンが語った2028年ロードマップとNVLink 8の衝撃 -
第872回
PC
NVIDIAのRubin UltraとKyber Rackの深層 プロトタイプから露見した設計刷新とNVLinkの物理的限界 -
第871回
PC
GTC 2026激震! 突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰 -
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 - この連載の一覧へ











