Atomの新アーキテクチャー
Tremont
チップセットの話はこのあたりにして、ここからはCPUアップデートの話だ。前回はCoreアーキテクチャーのみを紹介したが、Atomにも若干のアップデートがある。
インテルのRonak Singhal氏(Intel Fellow, Core and Visual Computing Group Director, CPU Computing Architecture, Intel Architecture Cores Group)が4月5日にこんなTweetをしている。
Latest version of our document with upcoming ISA extensions now available, including some new instructions detailed for the first time: https://t.co/bV2QC2Uw8M
— Ronak Singhal (@rsinghal1) 2018年4月4日
アップデートされたのは“Intel Architecture Instruction Set Extensions and Future Features Programming Reference”で、名前の通りx86/Intel 64の命令セット一覧である。ここのFeatureページにTremontの文字が出現したことで、ちょっとした騒ぎになった。
このマニュアルはあくまで命令セットであって、マイクロアーキテクチャーがどうなってるという話は一切載っていないため、Tremontがどんなものなのかはさっぱりわからない。
マイクロアーキテクチャーが載っているのはIntel Softwareの“Intel 64 and IA-32 architectures optimization reference manual”の方だが、見ていただくとわかるがGoldmont Plusどまりである。
このTremontは、コード名一覧にも載っていない。今回追加されている命令はAVX系ではなくIntel 64の方で、以下のようになっている。
追加された命令 | ||||||
---|---|---|---|---|---|---|
命令 | 搭載マイクロアーキテクチャー | |||||
GFNI(SSE) | Ice Lake and later Future Tremont and later |
|||||
ENCLV | Ice Lake Server and later Tremont and later |
|||||
Split Lock Detection | Ice Lake and later Tremont and later |
|||||
CLDEMOTE | Tremont and later | |||||
Direct stores: MOVDIRI, MOVDIR64B | Future Tremont and later | |||||
User wait: TPAUSE,UMONITOR, UMWAIT | Future Tremont and later |
登場時期はIce LakeやIce Lake Server(Ice Lake-SPのことだろう)より後になると思われる。ということは、製造プロセスは10nmと考えるのが妥当だろう。
ちなみにAtomの場合、当初のBonnell(45nm)/Saltmont(32nm)はIn-orderの2命令同時実行(Photo02)、Silvermont(22nm)/Airmont(14nm)は2命令発行のOut-of-Order(Photo03)、Goldmont(Photo04)/Goldmont+(Photo05)は3命令同時発行のOut-of-order構成である。
ということは次は4命令同時発行か……という考えがよぎるが、そこまで行くとCoreとの差がなくなり、同程度に巨大なダイになりかねない。消えてしまったKnights Hillに搭載予定だったAtomコアにはひょっとして、という話があった。
というのはその前世代のKnighs LandingはAtomコアに2つのVPU(AVX-512ユニット)を組み合わせたものだが、仮にKnights Hillでも同じ構成だとすると、2つのVPUをフルに活用するためにはロードストアユニットも2つ(VPUあたり1つ)ないと帳尻が合わなくなるからだ。
VPU2つとロードストアユニット2つを同時に動かすためには4命令同時発行でないと間に合わないわけで、ここから4命令という話が出てきた。
ただKnights Hillが消えた今となっては、そこまでのピーク性能は求められないため、個人的には3命令のままなのではないか、と考えている。
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ