配線損失を5%へ激減させる特効薬
Google流「垂直給電」の実力
さて本題である。GoogleもまたVPD(Vertical Power Delivery:垂直給電)をすでに実用化している。実はこれに関して同社は2024年のAPEC(IEEE Applied Power Electronics Conference and Exposition)で"Vertical Power Delivery for 1000 Amps Machine Learning ASICs"という論文を発表しているので、ここから解説したい。
下の画像のFig 1はASICを搭載する基板の温度を示したもので、実際VRからASICの間の数十mmの距離の間の温度が非常に高いのは、ここの部分で電力損失の大半が発生しているためである。
そこでVPDを利用することで、この配線長を最小化する(&配線の太さをより太くすることで抵抗を減らす)ことで配線抵抗を減らそう、というのが目的であることは前回も紹介した通り(Fig.2)。
一番下にあるFig.3は4種類のASICのコアに供給する電力と配線損失を比較したものである。消費電力が大して大きくないものであれば、そもそも電流が少ない(あと昔のASICは動作電圧も高いため、その分電流が少ない)が、最新のもの(ASIC 4)では従来方式のままでは25%近くの配線損失が発生するのに対し、VPDを使うとこれが5%程度にまで削減できるとしている。このグラフはVPDを実装する動機として十分な説得力がある。
では実際にどんな構造か、というのが下の画像だ。Fig 7が基板とASIC、それとVPDモジュールおよびVPD用のクーリングプレートである。前回富士通のSPARC64 XIIのVPDの実装方法をご紹介したが、Googleのやり方もこれにかなり近い。
やはり、VPDモジュールを直接基板に実装するのはいろいろと難点があるようだ。論文では熱による歪みの解析結果なども示されており、この構造でうまく歪をカバーできるとしている。VPDモジュールが下の画像である。
Fig.5がモジュール本体で、結構な厚みがあることがわかる。ちなみにこのモジュールは電圧0.8V、連続で1000A、ピークで1300Aの出力が可能な構成(内部は24フェーズだそうだ)。下のFig.6はこのVPDのテスト風景であるが、左の基板(3×IBCと書いてあるところ)から48Vが供給され、それがこのVPDで0.8Vに落とされて供給される形だ。
ちなみに右の評価基板は本来と逆で、上にVPDが載っており、それが銅製のクーラーで冷却されている。ASICの代わりにLoad Boardと呼ばれるもの(おそらく中身は抵抗の塊だろう)が下にくっついており、これが1000Aを消費しているので、さすがにこれは水冷でないと間に合わないようだ。
論文によればVPDのシステムを使うことで、流れる電流が増えても高い効率性を維持し続けられるとしている。この論文は2024年のAPEC(2024年3月)で発表されたものなので、試作や実験は2023年の時点ですでに完了している話である。
横軸が供給電流量、縦軸が効率である。100Aあたりであまり効率がよろしくないのは、DC-DCコンバーターの最適設計が400A以上になっているためだろう。それはそれとして、従来型の供給方法(青)では電流が増えると急激に効率が悪化するのが、VPDを使うと悪化はするものの大分緩やかになっているのがわかる
その後どうなったのか? というのが下の画像である。ここまで紹介してきたものはGen1に相当するもので、こちらはすでに広範に利用されていると説明されている。
これに加えてVPDに改良を加えたGen 1.5を挟み、現在はGen 2が利用されていることが明らかにされた。VPDの信頼性に関しては、Gen 1のものでも1年経過後の故障率は1桁台のDPPM(Defective Parts Per Million:100万個あたりの故障数)となっており、確かに実用に耐える品質が保たれていると言える。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第874回
PC
AIの未来は「電力」で決まる? 巨大GPUを支える裏面給電とパッケージ革命 -
第873回
PC
「銅配線はまだ重要か? 答えはYesだ」 NVIDIA CEOジェンスンが語った2028年ロードマップとNVLink 8の衝撃 -
第872回
PC
NVIDIAのRubin UltraとKyber Rackの深層 プロトタイプから露見した設計刷新とNVLinkの物理的限界 -
第871回
PC
GTC 2026激震! 突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰 -
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 -
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 - この連載の一覧へ
















