前回の続きでInstinct MI300Aについて説明する予定だったが、AMDに負けじとインテルが12月14日に“AI Everywhere”というイベントを開催。ここでMeteor LakeことCore UltraとEmerald Rapidsこと第5世代Xeon Scalableの正式発表を行なった。そこで今回は、予定を変更してインテルのイベント内容を解説していく。
Core Ultraと第5世代Xeon Scalableを発表
概略は発表記事ですでにレポートが上がっているので、ご覧になった方も多いだろう。本稿も内容が多いので2回に分割させていただく。今回はCore Ultraである。
Meteor Lakeの内部構造についてはこれまでも何度か説明している。連載734回や735回、739回、740回、741回などではけっこう細かいところまで掘り下げて説明したつもりだ。ただ構造はともかく最終スペックは今回が初の発表になるので、そうした部分を取り上げていく。
動作周波数などは後で説明するとして、まずスペックで目につくのは、以下の項目だろう。
- GPUが8 Xeコアとなった
- NPUが複数ストリームを実行可能
- メモリーコントローラーがLPDDR5xで最大7467MHz/64GB、DDR5で5600MHz/96GBまで対応
いろいろと性能に関する指標が出てきたので、今回はそのあたりも含めて順に説明する。まずマルチスレッド性能をCore i7-1370PやRyzen 7 7840U、Apple M3、Snapdragon 8cx Gen3などと併せて比較したのが下の画像だ。
Performance IndexによればCore Ultra 7 165Hの性能は以下のとおり。
- Core i7-1370P比で8%向上
- Ryzen 7 7840U比で11%向上
- Apple M3比で29%向上
- Snapdragon 3cx Gen3比で3.25倍
この手のベンチマークの常としてこれは怪しい。まずすべてのテストでCore Ultra 7 165HはLPDDR5-7467 16GB×2を搭載した社内の評価システムであり、一方比較対象はLenovo T16 AMD Ryzen 7-PRO-7840U(LPDDR5-6400 16GB×2)やLenovo X13(LPDDR4X-32GB)、MacBook Pro 14(LPDDR5 24GB)である。
Core i7-1370Pはやはり社内の評価システム(LPDDR5-6000 16GB×2)ということで、Core i7-1370PとCore Ultra 7 165Hの性能/消費電力の関係はおそらく正確だろうが、他の3製品の性能はともかくCPUの消費電力をどこまで正確に測定できているのかやや疑問である。
それなりに性能が高いことは間違いないはずだが、例えばRyzen 7 7840Uとのマルチスレッド性能の差が本当に11%あるのか? はけっこう疑わしい感じである。
そのうえ、SPECrate 2017_int_baseはけっこうメモリーの帯域で性能差が生じることを考えると、「LPDDR5-7467まで動作するのもCPU性能のうちだ」と主張されればそのとおりではあるが、同じLPDDR5-6400同士ではどこまで性能差があるのか、少し興味あるところだ。
もっとも、わりと信憑性の高そうな数字もある。下の画像はビデオ再生の際のSoC全体としての消費電力で、Core i7-1370Pで1540mWの消費電力がCore Ultra 7 165Hでは1150mWまで削減されたとする。
この場合、画面制御などに必要なCPU処理はSoCタイル内のLP Eコアが使われ、またデコードもSoC タイル内のメディアエンジンが担うため、CPUタイルやGPUタイルは本当にシャットダウンできる。これにより25%の省電力化が可能になった、というわけだ。ちなみに競合であるRyzen 7040Uシリーズと比較すると、最大79%の消費電力削減が可能になった、としている。
再び性能の話に戻るが、SPECrate 2017_int_baseを使っての1スレッドでの性能比較が下の画像だ。興味深いのは、1スレッドで言えばCore i7-1370Pの方がむしろ性能が上のことだろうか。
そもそもCore i7-1370Pに搭載されるGolden Coveと、Core Ultra 7 165Hに搭載されるRedwood Coveが基本的には同じで、1次キャッシュの容量が違う程度の差しかないという話は連載739回で説明したとおり。
この状況でCore i7-1370Pの方が8%ほどスコアが上、というのは要するにそれだけ実効動作周波数が高いということの裏返しでもある。これはCore i7-1370Pの方が動作周波数が早く上がりやすいということなのか、それともCore Ultra 7 165Hの方の最適化が十分でなくて、動作周波数の上がり方が遅いだけなのかは現状不明である。
同様にマルチスレッドでの性能比較が下の画像だ。こちらではCore Ultra 165Hが最高速になっているが、思ったほどに性能差がない。消費電力を同等にした場合にどこまで性能差が出るのかは気になるところだ。
実際の製品を利用した比較が下の画像。こちらではメディア・プロセシング系の比較である。ただProcyonのVideo EditingではおそらくAdobe Media Encoderの性能(≒シングルスレッド性能)が結果につながったのだろうと想像できるが、PugetBenchを使ったPremier Pro/Lightroomではどのあたりで性能差が出たのか興味ある部分だ。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ