Atomの新アーキテクチャー
Tremont
チップセットの話はこのあたりにして、ここからはCPUアップデートの話だ。前回はCoreアーキテクチャーのみを紹介したが、Atomにも若干のアップデートがある。
インテルのRonak Singhal氏(Intel Fellow, Core and Visual Computing Group Director, CPU Computing Architecture, Intel Architecture Cores Group)が4月5日にこんなTweetをしている。
Latest version of our document with upcoming ISA extensions now available, including some new instructions detailed for the first time: https://t.co/bV2QC2Uw8M
— Ronak Singhal (@rsinghal1) 2018年4月4日
アップデートされたのは“Intel Architecture Instruction Set Extensions and Future Features Programming Reference”で、名前の通りx86/Intel 64の命令セット一覧である。ここのFeatureページにTremontの文字が出現したことで、ちょっとした騒ぎになった。
このマニュアルはあくまで命令セットであって、マイクロアーキテクチャーがどうなってるという話は一切載っていないため、Tremontがどんなものなのかはさっぱりわからない。
マイクロアーキテクチャーが載っているのはIntel Softwareの“Intel 64 and IA-32 architectures optimization reference manual”の方だが、見ていただくとわかるがGoldmont Plusどまりである。
このTremontは、コード名一覧にも載っていない。今回追加されている命令はAVX系ではなくIntel 64の方で、以下のようになっている。
| 追加された命令 | ||||||
|---|---|---|---|---|---|---|
| 命令 | 搭載マイクロアーキテクチャー | |||||
| GFNI(SSE) | Ice Lake and later Future Tremont and later |
|||||
| ENCLV | Ice Lake Server and later Tremont and later |
|||||
| Split Lock Detection | Ice Lake and later Tremont and later |
|||||
| CLDEMOTE | Tremont and later | |||||
| Direct stores: MOVDIRI, MOVDIR64B | Future Tremont and later | |||||
| User wait: TPAUSE,UMONITOR, UMWAIT | Future Tremont and later | |||||
登場時期はIce LakeやIce Lake Server(Ice Lake-SPのことだろう)より後になると思われる。ということは、製造プロセスは10nmと考えるのが妥当だろう。
ちなみにAtomの場合、当初のBonnell(45nm)/Saltmont(32nm)はIn-orderの2命令同時実行(Photo02)、Silvermont(22nm)/Airmont(14nm)は2命令発行のOut-of-Order(Photo03)、Goldmont(Photo04)/Goldmont+(Photo05)は3命令同時発行のOut-of-order構成である。
ということは次は4命令同時発行か……という考えがよぎるが、そこまで行くとCoreとの差がなくなり、同程度に巨大なダイになりかねない。消えてしまったKnights Hillに搭載予定だったAtomコアにはひょっとして、という話があった。
というのはその前世代のKnighs LandingはAtomコアに2つのVPU(AVX-512ユニット)を組み合わせたものだが、仮にKnights Hillでも同じ構成だとすると、2つのVPUをフルに活用するためにはロードストアユニットも2つ(VPUあたり1つ)ないと帳尻が合わなくなるからだ。
VPU2つとロードストアユニット2つを同時に動かすためには4命令同時発行でないと間に合わないわけで、ここから4命令という話が出てきた。
ただKnights Hillが消えた今となっては、そこまでのピーク性能は求められないため、個人的には3命令のままなのではないか、と考えている。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











