Lunar Lakeはウェハー1枚からMeteor Lakeの半分しか取れない　インテル CPUロードマップ

2024年06月24日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

Lunar Lakeはウェハー1枚から426個しか取れない
歩留まりを考えると実質的に1枚から取れるのは255個ほど

　Lunar Lakeの構造は下の画像のとおりであるが、同じようにコンピュート・タイルの寸法を確認したところ、16.3×8.6mmほどになり、140.18mm²という数字が出てきた。

Lunar Lakeの構造。Filler tileは単なるダミーである

　連載734回でMeteor Lakeの寸法を推定した時が73.9mm²なので、ほぼ倍になる。Meteor Lakeならウェハー1枚から720個あまりのコンピュート・タイルが取れたのに対し、Lunar Lakeでは426個ほどになる計算だ。

　おまけに歩留まりが、もし先程の60%という数字が改善していないとすれば、実質的にウェハー1枚から取れるのは255個ほどである。そしてTSMCのN3のウェハーの価格は2万ドルを超える(安価になったN3Eで2万ドルを切るかもしれない)そうで、ということはコンピュート・タイル1つあたりの製造原価は78ドルくらいになる。

　これは結構な金額である。というのはLunar Lakeにはこれに加えてベース・タイル(Intel 22FFLベース)とプラットフォーム・コントローラー・タイル(これはTSMC N6)を、Foverosを使って積層し、そこにLPDDR5X-8533×2を載せ、さらに全体のパッケージが必要になるからで、製造原価を積み上げていったら200ドルでは効かないだろう(おそらく300ドル台)。

　あくまでも製造原価でこれである。製品価格は倍では効かないだろう。それでいて最終製品はSnapdragon X Eliteベースの製品に対して相応の価格競争力を持たせないといけない。今回構成には相当悩んだものと思われる。最終的にPコア×4+Eコア×4という形にし、Meteor Lakeで実装されたI/OタイルのLP Eコアを省いた、というあたりもこのあたりの損得勘定を相当考えてのことと思われる。

　「だったらなにも全部コンピュート・タイルに入れる必要はなかったのでは？」という疑問は当然湧くわけだが、競合がSnapdragon Xであることを考えるとNPUの絶対性能の向上は必須である。

　Meteor LakeのNPU構成は連載740回で示したとおりだが、Copilot+の要件である40TOPSの性能を引き出そうとすると、4倍の性能改善が必要になる。

　Meteor Lakeでは2つだったNCE(Neural Compute Engine)はLunar Lakeでは6個になり、しかも動作周波数は1GHz→1.6GHzに強化されたことで48TOPS(NCPの数が3倍、動作周波数が1.6倍)を実現したと考えられるが、まずNCEを3倍に増やす時点で、N6ではダイの面積が大きくなりすぎる。しかも動作周波数を引き上げつつ消費電力を抑えようとすると、N6やN5では厳しく、N3クラスのプロセスが必要になる。

　GPUも同様に、限られたエリアサイズでそれなりの性能を発揮する必要がある。Meteor Lakeの場合と異なり、外部にディスクリートGPUを装着するという選択肢はあり得ないので、ある程度の性能を自前で確保する必要がある。

　Lunar LakeではMeteor LakeのX^e-LPGを改良したX^e2を搭載するが、X^eコアの数は同じ(最大8)ながら、動作周波数をそこまで上げられない(Meteor LakeのハイエンドであるCore Ultra 9 185Hは最大2.35GHz駆動)。

　もう1つの問題はメモリー帯域で、LPDDR5X-8533×2だが、帯域そのものは68.3GB/秒程度でしかない。というのはLPDDR5X-8533がx32構成のためである。これも筆者には疑問で、x64構成のものを使えば2つで128bit幅が実現でき、十分なメモリー帯域が確保できるはずなのだが、現状ではDDR5-5600搭載のMeteor Lake(89.6GB/秒)にも劣る帯域になっている。

　パッケージ、あるいは配線の取り回しの関係でx64を選べなかったのか、それとも入手量の関係で選べなかったのか、あるいはなにか他の理由かはわからないが、とにかく利用できるメモリー帯域がMeteor Lakeより下がっている中で性能を確保するためにいろいろと仕組みに工夫を凝らさざるを得ず、結果的にこちらもN3Bでないと収まらなかったのではないかと想像される。

　またGPUに関しては、現状少なからぬアプリケーションがGPUでAI推論を行なっており、こちらに向けての性能強化をしている中で、低い消費電力枠で相応に動作周波数を引き上げる(1.6GHz)ためにはN3Bが必要だった、という見方もできる。

　といったあたりで、仮にGPUなどを別タイルにしても結局N3Bで製造するなら、もう一緒にした方が楽、という判断が下されたのではないかと筆者は想像している。

　要するにLunar Lakeはいろいろと厳しい制約条件の中で、最大限Snapdragon Xに肩を並べる性能を確保するために、変な実装になっている感が非常に強い製品である。次回から、もう少しコンポーネント別に詳細を説明していく。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ