前回の続きでInstinct MI300Aについて説明する予定だったが、AMDに負けじとインテルが12月14日に“AI Everywhere”というイベントを開催。ここでMeteor LakeことCore UltraとEmerald Rapidsこと第5世代Xeon Scalableの正式発表を行なった。そこで今回は、予定を変更してインテルのイベント内容を解説していく。
Core Ultraと第5世代Xeon Scalableを発表
概略は発表記事ですでにレポートが上がっているので、ご覧になった方も多いだろう。本稿も内容が多いので2回に分割させていただく。今回はCore Ultraである。
Meteor Lakeの内部構造についてはこれまでも何度か説明している。連載734回や735回、739回、740回、741回などではけっこう細かいところまで掘り下げて説明したつもりだ。ただ構造はともかく最終スペックは今回が初の発表になるので、そうした部分を取り上げていく。
動作周波数などは後で説明するとして、まずスペックで目につくのは、以下の項目だろう。
- GPUが8 Xeコアとなった
- NPUが複数ストリームを実行可能
- メモリーコントローラーがLPDDR5xで最大7467MHz/64GB、DDR5で5600MHz/96GBまで対応
いろいろと性能に関する指標が出てきたので、今回はそのあたりも含めて順に説明する。まずマルチスレッド性能をCore i7-1370PやRyzen 7 7840U、Apple M3、Snapdragon 8cx Gen3などと併せて比較したのが下の画像だ。
Performance IndexによればCore Ultra 7 165Hの性能は以下のとおり。
- Core i7-1370P比で8%向上
- Ryzen 7 7840U比で11%向上
- Apple M3比で29%向上
- Snapdragon 3cx Gen3比で3.25倍
この手のベンチマークの常としてこれは怪しい。まずすべてのテストでCore Ultra 7 165HはLPDDR5-7467 16GB×2を搭載した社内の評価システムであり、一方比較対象はLenovo T16 AMD Ryzen 7-PRO-7840U(LPDDR5-6400 16GB×2)やLenovo X13(LPDDR4X-32GB)、MacBook Pro 14(LPDDR5 24GB)である。
Core i7-1370Pはやはり社内の評価システム(LPDDR5-6000 16GB×2)ということで、Core i7-1370PとCore Ultra 7 165Hの性能/消費電力の関係はおそらく正確だろうが、他の3製品の性能はともかくCPUの消費電力をどこまで正確に測定できているのかやや疑問である。
それなりに性能が高いことは間違いないはずだが、例えばRyzen 7 7840Uとのマルチスレッド性能の差が本当に11%あるのか? はけっこう疑わしい感じである。
そのうえ、SPECrate 2017_int_baseはけっこうメモリーの帯域で性能差が生じることを考えると、「LPDDR5-7467まで動作するのもCPU性能のうちだ」と主張されればそのとおりではあるが、同じLPDDR5-6400同士ではどこまで性能差があるのか、少し興味あるところだ。
もっとも、わりと信憑性の高そうな数字もある。下の画像はビデオ再生の際のSoC全体としての消費電力で、Core i7-1370Pで1540mWの消費電力がCore Ultra 7 165Hでは1150mWまで削減されたとする。
この場合、画面制御などに必要なCPU処理はSoCタイル内のLP Eコアが使われ、またデコードもSoC タイル内のメディアエンジンが担うため、CPUタイルやGPUタイルは本当にシャットダウンできる。これにより25%の省電力化が可能になった、というわけだ。ちなみに競合であるRyzen 7040Uシリーズと比較すると、最大79%の消費電力削減が可能になった、としている。
再び性能の話に戻るが、SPECrate 2017_int_baseを使っての1スレッドでの性能比較が下の画像だ。興味深いのは、1スレッドで言えばCore i7-1370Pの方がむしろ性能が上のことだろうか。
そもそもCore i7-1370Pに搭載されるGolden Coveと、Core Ultra 7 165Hに搭載されるRedwood Coveが基本的には同じで、1次キャッシュの容量が違う程度の差しかないという話は連載739回で説明したとおり。
この状況でCore i7-1370Pの方が8%ほどスコアが上、というのは要するにそれだけ実効動作周波数が高いということの裏返しでもある。これはCore i7-1370Pの方が動作周波数が早く上がりやすいということなのか、それともCore Ultra 7 165Hの方の最適化が十分でなくて、動作周波数の上がり方が遅いだけなのかは現状不明である。
同様にマルチスレッドでの性能比較が下の画像だ。こちらではCore Ultra 165Hが最高速になっているが、思ったほどに性能差がない。消費電力を同等にした場合にどこまで性能差が出るのかは気になるところだ。
実際の製品を利用した比較が下の画像。こちらではメディア・プロセシング系の比較である。ただProcyonのVideo EditingではおそらくAdobe Media Encoderの性能(≒シングルスレッド性能)が結果につながったのだろうと想像できるが、PugetBenchを使ったPremier Pro/Lightroomではどのあたりで性能差が出たのか興味ある部分だ。
この連載の記事
-
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ