3次キャッシュの形を変更
SRAMの実装密度を引き上げ、回路設計を工夫することで性能を向上
次に物理実装の話だ。プロセスノードを進めても、必ずしもすべてのものが連動して密度が向上するわけではない。ロジック、つまりトランジスタ1個の面積が一番アグレッシブに微細化が進むが、配線の微細化はもっとゆっくり進む。理由は連載809回のインテルのIEDMの発表のところでも述べたが、もう銅配線はこれ以上微細化を進めると配線抵抗が大きくなり、かつエレクトロマイグレーションの影響がシャレにならないほど大きくなるためである。
Intel 4ではエレクトロマイグレーション対策として、銅配線をコバルトのライナーで囲み、その外側を窒化タンタルで覆ったeCU(Enhanced Cu)という技術を採用したという説明を連載675回でしたが、ならばeCuを使えば配線の幅を半分に減らせるかといえばそんなわけもなく、Ru(ルテニウム)を使った配線を利用することを模索しているが、実現するのは早くて2030年代である。
その先として有望なのはカーボンナノチューブであるが、こちらはもっと実現までに時間がかかる。結果、当面はコバルトや窒化タンタルを組み合わせながら、少しずつ配線の微細化を進めるしかない。SRAMはフリップフロップ回路を利用して構成され、一番簡単なRSフリップフロップ回路なら4つのトランジスタで構築できるが、普通は6つないし8つのトランジスタを組み合わせて1bit分のSRAMを構築する。
TSMCは自社のHD SRAMは結構微細化ができるなどと発表しているが、AMDはそもそも自社でSRAM回路を作って実装しており、TSMCの数字がそのまま使えるわけではないことに注意
ということはこの6つなり8つのトランジスタをつなぐ配線が必要であり、この配線を微細化しにくいためにSRAMの微細化が進まない、という問題がある。そこでZen 4→Zen 5では以下の工夫を凝らしたとしている。
- 8トランジスタ構成のSRAMを6トランジスタ構成に変更するなど、実装密度を引き上げることで回路規模拡大に伴う利用するトランジスタ増の影響を最小限にする
- 内部バスの拡大と効率改善の両立
- より効率的な回路設計を実施
結果として、Zen 4とZen 5を比較した場合、トランジスタの数はCCXあたり65億個から79億個まで増えたのに同じ面積に抑え込めた、としている。ただ配線層が17層に増えているあたりは、配線密度が上げられないので層数を増やしてなんとか対応できた、ということが見て取れる。
TSMCのN5とN4は基本的なパラメーターはほぼ同じであり、ここでのトランジスタ密度増加や配線密度増加の効果はほとんど期待できない。65億個→79億個では21.5%ものトランジスタ増加であり、これはN5→N3なら容易だが、N5→N4では普通無理である
この最適化の結果、Zen 4とZen 5ではずいぶん3次キャッシュの形が変わった。Zen 4ではCCDの面積の35%を占めていたのが、大幅に改善した模様だ。ラフに言えばZen 4時代の3次キャッシュは36mm2ほどの面積だったが、これが28mm2ほどに縮小されたようだ。
Core Aspect Ratioは、CCD全体がZen 4までの横長からやや正方形に近い形になっている。その方が1枚のウェハーからとれるチップの数を増やせるわけで、歩留まり向上につながるわけだ。
ところでZen 5世代では3D V-Cacheの位置がZen 4世代までと逆になる、という話があったが、その模式図が下の画像だ。Zen 4世代は以下の形に改まった。
(1) CCDの裏面にTSVを構築する
(2) そこに3D V-Cacheの表面をSoICで積層する
という形になっていたが、Zen 5世代では
(1) 3D V-Cacheの裏面にTSVを構築する
(2) そこにCCDの表面をSoICで積層する
このメリットとしてAMDから挙げられたのは、「結果的にヒートスプレッダがCCDの真裏に位置することになるので、放熱効率が上がる」ということだった。Zen 4までの方式では、CCDとヒートスプレッダの間に3D V-Cache(とダミーのシリコンダイ)が挟まるので、そこで放熱効率が落ち、結果的に温度上昇に弱くなるためあまり動作周波数を上げられなかったが、Zen 5ではこうした問題が解決したとしている。
これは確かにメリットなのだがもう1つ大きなポイントとして、「CCDに3D V-Cache接続用のTSVを、ベースシリコンを貫通させる形で構築する必要がない」ことが挙げられる。ベースシリコンを貫通させるTSVを構築するのには相応のコストがかかる。ところがZen 4まででは、仮に3D V-Cacheが必要ない場合でもTSVを構築しておく必要があり、これがコスト増になった。
ところがZen 5ではTSVの構築は3D V-Cache側になるので、TSV構築のコストは3D V-Cache搭載による価格のプレミア分で吸収できる。3D V-Cacheを搭載しない場合には、そもそもTSVの構築が行なわれないから、原価が下がるわけだ。
メリットだけでなくデメリットもある。Zen 5世代の場合、TSVは配線側に構築されることになる。したがって構築そのもののコストは安いが、配線がTSVを避けるようにしなければならないので、若干窮屈になる。Zen 5で配線層が2層増えた理由の1つはこのあたりにあるかもしれない。それでも裏面にTSVを構築するよりは安価だと思うが。
そのZen 5のCCDのBreakdownが下の画像である。L3がスリムになった分、全体の横幅がやや小さくなった。おそらくこれは、Turinの16 CCD構成を取る際に、パッケージに乗りきらないという事態を起こさないためにどうしても必要だったのだろう。
全体で66mm2という数字も初出だったように思う。あとGMI3がTX(送信)×16、RX(受信)×20という非対称構成なのも初出だった。速度が36Gbpsなのは、Ryzenの方がZen 4と同じIoDを利用していることに関係しているのだろう
わりと細かい話ではあるが、Zen 4→Zen 5ではいろいろな隠れた工夫が凝らされていることがわかった発表であった。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ




