激変する消費電力への対策
電力供給レーンの追加とLock Stepの進化
最後が電力供給の話である。性能が上がるということは、より大きな消費電力になるとほぼ同義語であり、この結果、モードごとの消費電力の差が大きくなっている。
上の画像をもう少し細かく分析したのが下の画像で、5mWから20Wオーバーまで振れ幅が大きいのがわかる。
この急激な消費電力増加を従来型のパワーレーンで実現しようとすると、IR dropが倍になるという見積もりとなる。
そこで今回はチップの内部にも電力供給レーンを追加することで、電流密度が倍になってもIR dropを従来より13%下げられたとしている。
Power Gatingのための2nd PSW(Power Switch)をチップ内部にも配したことで、周囲のRing上のPSWがラッシュ電流を抑え、チップ内部のPSWがインピーダンス均一化に貢献した、と同社では説明している
それと意外に重要なのがLock Step動作。Lock Stepというのは2つのコアが同期して動作すると共に、常時両方の状態を監視。片方のコアに異常が発生したらそのコアを休止させ、もう片方で処理を実行する(この切り替えはリアルタイムで行なわれる)というもの。
古いところではTandemのマシンに採用されているが、とにかく停止させて再起動できない(走行中にコンピュータの再起動がおきるなんて悪夢でしかない)環境で採用されている。
自動車の場合、安全規格であるISO 26262という仕様の中にASIL-D(目標故障率が10億時間あたり1回未満)があり、これを満たさないといけないのだが、プロセッサー1個で実現するのは不可能である。
そこで複数のプロセッサーを同時に動かして、故障が起きたら正常なものに切り替えることでこのASIL-Dを満足させているわけだが、故障時はともかく正常時には消費電力が2倍になるわけで、ということはそれを1つのパワースイッチでまかなうと電流量が2倍になり、IR dropが著しい。
そこでLock Stepを構成する2つのCPUに加え、その2つのCPUを監視するユニット(DCLS Compare)も独立したパワースイッチを使うことで、各々に流れる電流を抑制する方式を取ったとする。
下の画像が今回試作したチップの構成で、3nmでありながら自動車用としてはかなり大きな、312mm2ものダイサイズになったそうだ。
自動車用の場合、そのプログラムを外部のNAND Flashなどに搭載することそのものが故障につながる(物理的に故障が起きやすい)ということでEmbedded Memory(Flash、MRAM、PCMなど)を使うことが多いのだが、さすがに3nmプロセスではEmbedded Memoryを構築するオプションがないようで、外部にUFS 4.0を2ch接続する(しかも2レーン構成)という仕様になっている
ちなみにこれはSoCダイの構成で、これとは別にチップレットが付く形になるのだが、そのチップレットとの接続の実績が下の画像で、51.18GB/秒のRead/Writeが可能であることが実証できたとする。
今回の構成は同社のR-Car X5Hとして実装されている。R-Carシリーズの一覧はこちらだが、R-Car X5Hに関してはリリースこそ出ているものの詳細はまだ未公開となっている。ただ自動車向けSoCも、こうしたいろいろなことを気にしないと実装できないほどに高度化してきている、という状況はご理解いただけるだろう。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第876回
PC
このままではメモリーが燃える! HBM4/5世代に向けた電力供給の限界と、Samsungが示すパッケージ協調設計の解 -
第875回
PC
1000A超のAIプロセッサーをどう動かすか? Googleが実践する垂直給電(VPD)の最前線 -
第874回
PC
AIの未来は「電力」で決まる? 巨大GPUを支える裏面給電とパッケージ革命 -
第873回
PC
「銅配線はまだ重要か? 答えはYesだ」 NVIDIA CEOジェンスンが語った2028年ロードマップとNVLink 8の衝撃 -
第872回
PC
NVIDIAのRubin UltraとKyber Rackの深層 プロトタイプから露見した設計刷新とNVLinkの物理的限界 -
第871回
PC
GTC 2026激震! 突如現れたGroq 3と消えたRubin CPX。NVIDIAの推論戦略を激変させたTSMCの逼迫とメモリー高騰 -
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 -
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする - この連載の一覧へ
















