SoICは2.5DのUCIeと比較して
2~3桁高い配線密度を実現できる
発表ではこのあとSanity Check(どこまで正常に動作しているか)の結果なども示されたが、これは割愛して最後にベンチマーク結果を説明しよう。これは実際にどの程度の性能を出せるか比較したもので、SoICは2.5DのUCIeと比較して2~3桁高い配線密度を実現できる、としている。
この最後の話についてだけ、もう少し解説しておきたい。もともとのUCIeはシリコンインターポーザーを前提とした2.5Dでの接続のみだったが、2024年8月にリリースされたRevision 2.0でUCIe-3Dと呼ばれるSoICタイプの接続にも対応するようになっている。
スペックからこの3つのパッケージの仕様を抜き出してまとめたのが下表である。
| の3つのパッケージの仕様 | ||||||
|---|---|---|---|---|---|---|
| Standard Package | Advanced Package | UCIe-3D | ||||
| Supported speeds (per Lane) |
4,8,12,16,24,32GT/s | up to 4GT/s | ||||
| Bump Pitch | 100μm~130μm | 25μm~55μm | < 10μm(Optimized) 10~25μm(Functional) |
|||
| Channel reach | 10mm(short) 25mm(long) |
2mm | 3D Vertical | |||
| BER | 1e-27 (<= 8 GT/s) 1e-15 (>= 12 GT/s) |
1e-27 (<= 8 GT/s) 1e-15 (>= 12 GT/s) |
1e-27 | |||
2.5Dタイプでは最大32GT/sまでの接続が可能なのに対し、UCIe-3Dは最大でも4GT/sと控えめなのは、なにしろ配線数を猛烈に増やせるからである。Standard/Advanced Packageの場合、配線はx16を基本にx32/x64あたりまでが想定されているが、UCIe-3Dは例えばx4096なども可能であり、信号速度を上げるとむしろ消費電力が上がってしまうので、信号速度は控え目にして、その分配線数を増やした方が得策である。
そもそも上の画像を見ると、SoICの方は簡単な送受信バッファを用意しているだけで、UCIeのI/Fを使っていないのがわかるかと思う。UCIeは基本的に外部バスの延長というか、間にプロトコル変換が入る形で互換性を高めるような工夫がなされているが、UCIeのこの例は内部バスをそのまま延長して接続するような構造である。
連載659回でAMDの3D V-Cacheの配線を説明し、これを元にした内部構造の推定もご説明したが、SoICを利用するとL3用SRAMの内部配線をそのまま延長させられる。
これが可能なのは、3次元方向の接続なので、配線距離が1mmにも満たないからというのが大きい。そして配線距離が短いということは、信号駆動のための電力も非常に抑えられたものとなる。実際PHYといってもESD保護用のクランプと、そのあと信号を正規化するアイソレーション回路だけで済んでいる。
ところがUCIeの場合はもっと配線距離が長くなるから、ちゃんとドライバーも必要だし、それだけ消費電力が増えることになる。UCIeを使わずに独自規格で接続してもこのあたりは変わらない。
水平方向の接続に内部バスの信号をそのまま出すことは不可能か? というと、そうとは限らない。その実例がSapphire RapidsやGranite Rapids、そしてSierra Forestなどで、これらはいずれもCPUコア同士をつなぐリングバスを外部まで引っ張っている。
ただ結果として例えばSapphire Rapidsは疑似的にであるが内部バスの長さが南北・東西方向ともに40mmもの長さになってしまっている。これだけの長さを引き回すと、当然信号の劣化が激しいから、これを補うためにバッファをあちこちに入れたり(これは通信のレイテンシー増加につながる)、信号の電圧を上げたり(これは消費電力増加につながる)という、好ましくない副作用を発生することになる。
チップレットの原理的な欠点は、チップの数が増えると水平方向の配線がどんどん長くなることで、これを避ける一番スマートな方法が縦方向の積層というわけだ。TSMCが次世代SoICで900Tbps/mm2/pJ/bitという高い高密度配線を実現できたというのは、要するに3D積層すると配線長が最小に抑えられることが大きい。
だからといってむやみやたらになんでもかんでも3D積層というわけに行かないのが目下の問題ではあるのだが、1つの方向性を明確に示したものとは言えるだろう。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ












