3次キャッシュがスリムになっていたZen 5、ISSCCで公開された詳報　AMD CPUロードマップ

2025年03月17日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

3次キャッシュの形を変更
SRAMの実装密度を引き上げ、回路設計を工夫することで性能を向上

　次に物理実装の話だ。プロセスノードを進めても、必ずしもすべてのものが連動して密度が向上するわけではない。ロジック、つまりトランジスタ1個の面積が一番アグレッシブに微細化が進むが、配線の微細化はもっとゆっくり進む。理由は連載809回のインテルのIEDMの発表のところでも述べたが、もう銅配線はこれ以上微細化を進めると配線抵抗が大きくなり、かつエレクトロマイグレーションの影響がシャレにならないほど大きくなるためである。

　Intel 4ではエレクトロマイグレーション対策として、銅配線をコバルトのライナーで囲み、その外側を窒化タンタルで覆ったeCU(Enhanced Cu)という技術を採用したという説明を連載675回でしたが、ならばeCuを使えば配線の幅を半分に減らせるかといえばそんなわけもなく、Ru(ルテニウム)を使った配線を利用することを模索しているが、実現するのは早くて2030年代である。

　その先として有望なのはカーボンナノチューブであるが、こちらはもっと実現までに時間がかかる。結果、当面はコバルトや窒化タンタルを組み合わせながら、少しずつ配線の微細化を進めるしかない。SRAMはフリップフロップ回路を利用して構成され、一番簡単なRSフリップフロップ回路なら4つのトランジスタで構築できるが、普通は6つないし8つのトランジスタを組み合わせて1bit分のSRAMを構築する。

TSMCは自社のHD SRAMは結構微細化ができるなどと発表しているが、AMDはそもそも自社でSRAM回路を作って実装しており、TSMCの数字がそのまま使えるわけではないことに注意

　ということはこの6つなり8つのトランジスタをつなぐ配線が必要であり、この配線を微細化しにくいためにSRAMの微細化が進まない、という問題がある。そこでZen 4→Zen 5では以下の工夫を凝らしたとしている。

8トランジスタ構成のSRAMを6トランジスタ構成に変更するなど、実装密度を引き上げることで回路規模拡大に伴う利用するトランジスタ増の影響を最小限にする
内部バスの拡大と効率改善の両立
より効率的な回路設計を実施

より高密度実装のための(CADの)アルゴリズム考案とか、配線の最適化にMLを利用する、など開発ツールのレベルでの改良もけっこうあったとする

　結果として、Zen 4とZen 5を比較した場合、トランジスタの数はCCXあたり65億個から79億個まで増えたのに同じ面積に抑え込めた、としている。ただ配線層が17層に増えているあたりは、配線密度が上げられないので層数を増やしてなんとか対応できた、ということが見て取れる。

TSMCのN5とN4は基本的なパラメーターはほぼ同じであり、ここでのトランジスタ密度増加や配線密度増加の効果はほとんど期待できない。65億個→79億個では21.5%ものトランジスタ増加であり、これはN5→N3なら容易だが、N5→N4では普通無理である

　この最適化の結果、Zen 4とZen 5ではずいぶん3次キャッシュの形が変わった。Zen 4ではCCDの面積の35%を占めていたのが、大幅に改善した模様だ。ラフに言えばZen 4時代の3次キャッシュは36mm²ほどの面積だったが、これが28mm²ほどに縮小されたようだ。

Zen 3/4世代では3D V-Cache用に結構な量のTSVのエリアが用意されていたが、これをだいぶ縮小できたらしい

　Core Aspect Ratioは、CCD全体がZen 4までの横長からやや正方形に近い形になっている。その方が1枚のウェハーからとれるチップの数を増やせるわけで、歩留まり向上につながるわけだ。

　ところでZen 5世代では3D V-Cacheの位置がZen 4世代までと逆になる、という話があったが、その模式図が下の画像だ。Zen 4世代は以下の形に改まった。

これはあくまでも模式図であって実際の断面写真ではない(なにしろ左右の写真が完全に同一である)

(1) CCDの裏面にTSVを構築する
(2) そこに3D V-Cacheの表面をSoICで積層する
という形になっていたが、Zen 5世代では
(1) 3D V-Cacheの裏面にTSVを構築する
(2) そこにCCDの表面をSoICで積層する

　このメリットとしてAMDから挙げられたのは、「結果的にヒートスプレッダがCCDの真裏に位置することになるので、放熱効率が上がる」ということだった。Zen 4までの方式では、CCDとヒートスプレッダの間に3D V-Cache(とダミーのシリコンダイ)が挟まるので、そこで放熱効率が落ち、結果的に温度上昇に弱くなるためあまり動作周波数を上げられなかったが、Zen 5ではこうした問題が解決したとしている。

　これは確かにメリットなのだがもう1つ大きなポイントとして、「CCDに3D V-Cache接続用のTSVを、ベースシリコンを貫通させる形で構築する必要がない」ことが挙げられる。ベースシリコンを貫通させるTSVを構築するのには相応のコストがかかる。ところがZen 4まででは、仮に3D V-Cacheが必要ない場合でもTSVを構築しておく必要があり、これがコスト増になった。

　ところがZen 5ではTSVの構築は3D V-Cache側になるので、TSV構築のコストは3D V-Cache搭載による価格のプレミア分で吸収できる。3D V-Cacheを搭載しない場合には、そもそもTSVの構築が行なわれないから、原価が下がるわけだ。

　メリットだけでなくデメリットもある。Zen 5世代の場合、TSVは配線側に構築されることになる。したがって構築そのもののコストは安いが、配線がTSVを避けるようにしなければならないので、若干窮屈になる。Zen 5で配線層が2層増えた理由の1つはこのあたりにあるかもしれない。それでも裏面にTSVを構築するよりは安価だと思うが。

　そのZen 5のCCDのBreakdownが下の画像である。L3がスリムになった分、全体の横幅がやや小さくなった。おそらくこれは、Turinの16 CCD構成を取る際に、パッケージに乗りきらないという事態を起こさないためにどうしても必要だったのだろう。