SoCタイルは省電力性を最大限に生かす設計
では、そのMeteor Lakeの構造である。内部構造の推定は連載720回でお届けしたが、おおむね米国で特許出願した際の構造に近いものとなった。
ただこの図ではコンピュート・タイルはPコア×2+Eコア×8であるが、今回説明されたものはPコア×6+Eコア×8の構成であり、またIOタイルも存在する。これはいわばSKU次第であって、ローエンド向けにはPコア×2+Eコア×8でIOタイルなしのものもあるかもしれない。
また連載720回では4次キャッシュの存在の可能性について論じたが、少なくとも現時点では4次キャッシュに関しての言及がまったくない。
ただし大きな違いはSoCタイルに搭載されている2コアのEコアである。筆者はこの2コアのEコアを「セキュリティ制御専用と言うよりは、SoC側のもろもろの処理をCPUタイル上のCPU Complexを動かすことなく行なえるようにしよう、ということのようだ。」と書いたが、間違ってはいないものの正確ではなかった。
確かにブートの際にはセキュアブートなどの処理のために利用されるのだろうが、OSの起動後はこのSoCタイルのEコアもまたOSの管理下に置かれることになる。つまりMeteor LakeのCPUコアはPコア×6+Eコア×10になる。
もっともここからがMeteor Lakeの大きな特徴である。ハードウェア的に言えばコンピュート・タイルのEコアもSoCタイルのEコアも同じCrestmontコアであるが、コンピュート・タイルの方はIntel 4プロセスで「最大のマルチスレッド性能」を発揮するように実装されているのに対し、SoCタイルの方はTSMC N6で省電力性を最大限に生かすような実装になっている。
要するに物理設計におけるPPA(Power, Performance and Area)のターゲットが、コンピュート・タイルの方はやや高性能寄りになっているのに対し、SoCタイルの方は省電力/省エリアサイズに振った形になっている。この結果として、それぞれのコアの性能は見事にばらけることになる。
ではこれをどうやって制御するかであるが、スレッド・ディレクターにずいぶん手が入った。下の画像がその模式図である。基本CreateThread()やpthread_create()などで生成されたスレッドは、親スレッドと同じプロセッサーコア上で稼働しそうな気もするのだが確証はない。
Alder Lake/Raptor Lakeでは、テーブルの登録に応じてPコアないしEコアに処理が割り当てられ、その後も監視しながら負荷が低いものはEコアに、負荷が高いものはPコアに移行する形で負荷分散を図っているのが原則である。
これに対して、Meteor Lakeではまずすべての処理はSoCタイルのEコアで動かし、ここで負荷が大きい場合はコンピュート・タイルのEコアに移行させ、それでも足りなければPコアに移行する。
この結果として、例えばOSのタスク類は常にSoCタイルのEコアで動き、コンピュート・タイルのEコア/Pコアはアプリケーションの処理に割り当てられる、というのはインテルの説明である。
連載735回で、Meteor LakeのDVFS(Dynamic Voltage and Frequency Scaling)にはAIが利用されていると説明した。おそらくはAIを利用してタスクをIdle/Fixed QoS/Sustained/Burstyに分類、それぞれの特徴に応じて動作周波数や電圧の制御を行なうというものだが、これは単にDVFSだけでなくスレッド・ディレクターでも活用されていると考えられる。
OSのタスクはFixed QoSあたりに分類され、基本はSoC Eコアで。そしてアプリケーションの処理はSustained/Burstyに分類され、コンピュート・タイルのEコアやPコアに推移すると思われる。
思うに、まずSoCタイルのEコアで動かすのは、そのEコアでの稼働中に動作状態のサンプルを取り、そのサンプルを基にタスクの種類をAIを使って判断するためと考えられる。
ただ別の見方をすると、Alder Lakeの時に説明された「省電力のEコアとパフォーマンスのPコア」という分類は、Raptor Lakeの時点でだいぶ怪しかった(*1)が、Meteor Lakeでは省電力なのはSoCタイルのEコアのみで、コンピュート・タイルのEコアは“Efficient MT performance”を実現するあたりは、それなりに動作周波数が引きあがるものと考えられる。
もっともMeteor Lake、現在のパッケージがモバイル向けのみなので、最大でもH SKUの45~65Wで、メインはP SKUの28~35Wレンジになるだろうと考えると、どこまで動作周波数が積みあがるのかはわからない。
(*1) フル稼働時はEコアも限界までぶん回すことでマルチスレッド性能を引き上げるという実装になり、結果としてRaptor Lakeを爆熱CPUに仕立て上げた。
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ