Power Gatingによりリーク電流も削減
実行ユニットにMeromとほとんど差がないNehalemは、若干の命令の高速化やSSE 4.1/4.2の追加がなされた程度の変更に止まった。Load/Storeユニットに関しても、帯域そのものが変わらないのであれば、あまり強化しても意味がないと判断したのか、若干の改良を施す程度で終わった。そういう意味では、Core 2とNehalemに大きな性能差はない。すくなくともIPCに関して言えば、パイプラインレベルでのドラスティックな改善はされていない。
それにもかかわらず、Nehalemの性能はそれなりに改善しているのだが、これはCPUコア以外に起因する部分が大きい(関連記事)。ひとつはキャッシュ構造を3段階にして、2次キャッシュの容量を減らした(2MB~6MB→256KB)ことで、2次アクセスのレイテンシーを削減できるようになったことがある。もうひとつは、3次キャッシュに加えてメモリーコントローラーもCPUコアと統合したことで、こちらのアクセスレイテンシも削減できるようになったことだ。
Nehalemではメモリー帯域そのものも増えている。Melom/Penryn世代は原則としてDDR2を使っていたのが、NehalemからはDDR3に移行している。これらは言わば「足回りの強化」であるが、足回りががっちりすればエンジンが同じでもより速く走れるようになるという、いい見本とも言える。
パイプラインそのものと無関係ではあるが、Nehalemの世代で導入されたものに「Power Gating」がある。図3は連載164回の「Pentiun M」で説明した、クロックゲーティング(Clock Gating)の模式図である。
図3の一番上が何もない場合で、中段がクロックゲーティングを施した場合である。クロックゲーティングによって、CMOS回路の「動作時消費電力」(Dynamic Power)を削減できると説明したが、これとは別に「静的消費電力」(Static Power)というものがある。いわゆる「リーク電流」と呼ばれるもので、何もしなくてもある程度電流が流れてしまうというものだ。
半導体製造各社では、リーク電流を削減するために、「歪ゲート」や「High-Kメタルゲート」(HKMG)など、さまざまなトランジスター回路技術を工夫してはいるものの、根絶は難しい。そこで「使ってない場合は電源も切っちゃえ」というのが、図2下段にあるPower Gatingである。要するに、回路そのものへの電源供給を止めてしまえばリーク電流も流れようがないから、静的消費電力も削減できることになる。
だが理屈は簡単でも、実装は難しい。例えば最近のCPUは、100W近い消費電力を使うが、CPUの電圧そのものは1.2V~1.5Vと非常に低い。「電力=電圧×電流」だから、CPUには60~80Aもの電流が流れていることになる。実際には、ピークで100Aを超えることも珍しくない。
実際には100Aを、ひとつのスイッチでオン/オフするわけではない。1000個以上のスイッチで分散するので、せいぜい1個あたり0.1A程度である。しかし350~180nm程度の「高耐電圧プロセス」ならばともかく、32nmのロジック向けプロセスでこれを構成するのは、至難の業である。
インテルはPower Gatingのために、専用の電源配線とトランジスターを開発した。プロセッサーの配線といえば、どんなに太くてもμm単位なのに、Power Gating用の配線は7mmという恐ろしく厚い配線を使っているあたりが、一筋縄ではいかなかったことを示している。
★
Nehalemの世代はチップセットの接続方法が変わったため、プラットフォームが全面的に刷新された。また回路技術的にも、Power Gatingが採用されるなど、大きな変更部分が多く、逆にパイプラインそのものの変更は、比較的穏当な範囲に収まっている。
当時は次のSandy Bridge世代で、パイプラインの大変更が予定されていることもあった。パイプライン以外が大きく変わるので、Nehalemではパイプラインそのものは手を入れたくなかったのかもしれない。パイプラインにそれほど手をいれなくてもNehalemは十分性能が良かったし、Power Gatingの効果で省電力性も改善したから、結果論ではあるがこの穏健路線は正解だったのだろう。
この連載の記事
-
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ - この連載の一覧へ