ロードマップでわかる!当世プロセッサー事情 第782回
Lunar LakeはNPUの動作周波数がアップし性能は2倍、ピーク性能は4倍に インテル CPUロードマップ
2024年07月29日 12時00分更新
NPUの動作周波数が向上
同じ消費電力なら性能は最大で2倍、ピーク性能は4倍に
次が動作周波数の向上である。今回Lunar LakeのNPU 4が実際にどの程度の動作周波数で稼働するかに関する明確な数字は示されていない。ただし性能/消費電力比に関しては示されており、同じ消費電力なら性能は最大で2倍であり、またピーク性能は4倍になるとしている。
NPU 3の性能が相対的にそんなに高くないのは、そもそもNPU自身がSoCタイルという省電力ドメインで動作しているためで、TSMC N6プロセスだから動作周波数も上がりにくいし、面積的にもこれ以上NCEの数は増やしにくい。
Lunar LakeではこれがTSMC N3Bで製造されるコンピュート・タイルに移行したことで、ラフに言ってロジック密度は3倍(N7→N5で80%、N5→N3で72%のLogic Density向上とTSMCは説明しており、これをそのまま掛けると3.1倍くらいになる)に向上したことで、おそらくNPU 4はNPU 3からそれほど大きくは面積を増やさずに、2 NCE→6 NCEを実現している。
「大きくは増やさずに」というのは、NCEの中でもMACアレイなどはこの密度向上の効果が得られやすいが、スクラッチパッドや2次キャッシュはSRAMの塊であり、ここは密度向上が効きにくいためである。
さて問題は動作周波数の方である。上の画像を見ると、性性能は4倍ということになる。性能そのものは45.88TOPSほどになる計算で、この場合動作周波数は1.333...倍になるので、動作周波数は1.866...GHzになる。
これは切りが悪いので1.85GHzとすれば45.47TOPSほどでつじつまが合うし、TSMC N3Bならこの程度の周波数での動作は容易である。ただ問題は、画像のグラフと微妙に合っていないことだ。というのは、グラフ左下を原点とすると、NPU 4のピーク性能は3.67倍ほどになる計算だ。
「グラフが正確に描画されている」という前提であれば、原点は下の画像の位置になると思われ、この場合NPU 4がフルに稼働した場合の消費電力比は2.58倍ほどになる計算である。
2.56倍の消費電力で4倍の性能なので、性能/消費電力比的には十分帳尻は合っているし、2 NPC換算で言えば1.3倍の動作周波数向上を15%の消費電力削減とともに実現している計算になるため、N6→N3Bの移行は正解だっただろう。
逆に言えば、コンピュート・コア側にNPUを移動させない限り、この性能と消費電力は実現できなかったという話で、単にエリアサイズ(3倍の規模のNCEを、ほぼMeteor Lakeと同等の面積に抑える)以外にもN3Bに移行すべき理由があった、ということである。
この連載の記事
-
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ