Alder LakeはWillow Coveベースの
高速動作対応改良版
ではTSMCのN6を使うのはどれか? 筆者も確信があるわけではないが、 次期Xeonスケーラブル・ファミリーのSapphire Rapidsではないかと考える。逆説的になるが、Alder Lakeはおそらくインテルの10nm++を使い、しかも10nm++に最適化したコアになっているだろう。
なにを言っているかと言えば、かつて14nmプロセスが登場した時、これに素直に対応したBroadwellでは動作周波数がさっぱり上がらなかった。これがちゃんと上がったのはSkylakeが出てからであるが、これはプロセスを改良したのではなく、パイプライン段数を増やすなどして14nmでも動作周波数を引き上げられるようにコアの側で配慮した製品である。
この結果としてBroadwellに比べてグンと消費電力が増えている。同じことがAlder Lakeでも起きているように思える。つまりAlder LakeはGolden Coveベースではなく、Willow Coveベースの高速動作対応改良版ではないかと筆者は考えている。
傍証はいくつかある。6月末の時点でark.intel.comでAlder lakeを検索すると、下の画像が出てくる。この時点でAlder Lakeが1700padになることが明らかにされたわけだ。
現在のLGA 1200から500padも増やす理由はなにか? もちろんコネクティビティー周りの充実などもあるのだろうが、一番考えやすいのはさらに消費電力が増えることだ。
以下の話は確証がないのだが、Alder LakeではTDPが150Wに達するらしい(125W版もあるらしいが)。TDP(=PL1)が150Wということは、PL2は300Wあたりに設定されていても不思議ではない。1Vなら300Aである。それはVccとGNDのPadを増やさないといけないだろう。
逆になぜここまで消費電力が増えるかと言えば、上に書いた通り現在の10nm+/10nm++で上まで動作周波数が伸びるようにコアの構造を作り替えた結果として、消費電力が増えたのだろう。そして、コンシューマー向けの場合はこれが許される。
Sapphire RapidsがTSMCのN6を採用するなら
コアはWillow Coveになる
一方Sapphire Rapidsであるが、こちらはXeon向けである。コアとしてはこちらもWillow Coveになるはずだ。Golden Coveはそもそもインテルの7nmを前提にした設計なので、TSMCのN6ではやや厳しいからだ。
ただAlder Lakeと異なり、こちらは高速動作対応に拡張していないと思う。なぜかといえば、Xeonは真剣に性能/消費電力比を改善することが求められているからだ。
インテルの稼ぎ頭がDCG(Data Center Group)であることはご存じの通りで、この第2四半期でも素晴らしい成績を残しているが、その足元で次第にXeonのシェアが減りつつある。
言うまでもなくEPYCプロセッサーがXeonのシェアを喰っているからであるが、単に性能だけでなく省電力性が大きな武器になっており、ここをなんとかしないとXeon→EPYCへのシフトがさらに進むことになりかねない。
もう理由を1つ挙げておくと、Sapphire RapidsはAuroraへの搭載も予定されているが、Auroraは単に1EFlopsを実現するだけでなく、消費電力にも厳しいはずだ。以前、1Exaflopsのマシンを20MWの消費電力で構築するDOE Exascale Initiativeの話を連載435回で解説した。
20MWはやはり厳しいので30MWくらいに緩和されたが、Auroraもこれを下敷きにしているはずで、公表はされていないもののシステム全体の消費電力が契約で規定されていると思われる。
現状で言えば、TOP500のトップである富岳の消費電力が14.67TFlops/Wなので、このまま1Exaflopsにスケールさせると消費電力は68MWほどになる。
Green500の方のトップは日本のPreferred NetworksのMN-3であるが、こちらは1621.1TFlops/76.8KWなので、このままスケールできれば4.7MWほどで1Exaflopsが実現できる計算になるが、そこまでスケールできないのが問題であって、Auroraでは別の方法を考えねばならない。
一番肝心のGPUは前述のようにTSMCのN5を使うとして、CPUもやはり相応に消費電力を落とさないと難しいだろうというのは容易に想像がつく。こうした用途では、無理にパイプラインを増やさなくても素直に上まで動作周波数が伸びる(=そこそこの性能を狙うと消費電力がグンと下がる)N6は、こうした要件にうまくマッチすると思われる。
実のところ18万枚というN6のウェハーはAMDより少ないわけで、インテルがクライアント向けに出しているCPUをカバーするにはあまりに少ない。これはXeonと、あとは一部Core-X向けの製造に使われる程度で終わってしまうだろう。
とりあえず今回の決断は、インテルの7nmが実用になるまでのつなぎとして、TSMCのN6(およびおそらくN5)を使うという話であって、長期的には自社の7nmプロセスを使って製造することそのものはまだあきらめていない。これをあきらめたら、Fab 42への投資が丸々無駄になってしまう。
そうでなくても現状インテルは10nmのライン(D1B/D1C/D1D/D1X/Fab28/Fab42)がかなり遊んでいる状況になっており、これまでのシャレにならない投資が全然回収できていない。
もちろん今は14nmプロセスがフル回転してくれているお陰でそうした部分は見えてこないが、その14nmが敬遠される事態になった時にいきなり苦境に陥ることになる。それを防ぐためにも、なんとしても7nmを早期に立ち上げたいところだろうが、はたしてどうなるか注視していく必要がある。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ