SMTによる3つの利点
こうしたSMTの利点を挙げると、以下のようになる。
- 性能向上
- レイテンシー遮蔽
- 省電力
まず性能向上だが、これは純粋に2つのスレッドを同時に実行できるようになるためで、その分の性能改善が期待できる。ダイサイズが5%増えるだけで性能が増えるのだから、これは美味しい技である。もっとも無尽蔵に性能が改善できるわけもなく、一般には30%程度とされている。
あくまでもSMTは、「実行ユニットが空いている場合に、ほかのスレッドの処理をそこに埋め込む形で実行ユニットを効率よく利用する」という技術だから、仮に実行ユニットがフルに使われていたりすると、むしろオーバーヘッドになってしまう可能性もある。
次のレイテンシー遮蔽であるが、これは広義には性能改善に含まれる項目である。図4上段のように、2次キャッシュからデータを取り込んで加工するスレッドがあったとする。これを単独で実行すると、2次キャッシュのアクセス待ちが定期的に発生するので、パイプラインの利用効率はあまりよろしくない。
そこで、同じようなスレッドを2つ同時に走らせた場合、一方のスレッドが2次アクセス待ちの最中に、別のスレッドが実行できることになるので、見かけ上2次アクセスの待ちがないように扱われることになる。これは特にマルチスレッド化しやすい処理でよく利用される(エンコーダーや3D CGレンダリングなどが好例)。
3つ目の省電力はちょっとわかりにくいが、SMTを利用することで性能が上がるなら、逆に必要とする処理性能を実現する際に、動作周波数を落とすことが可能になるということだ。組み込み向けプロセッサーにおける事例だが、例えばインフィニオン・テクノロジーズが車載向けなどに販売中の「TriCore 2」は、レイテンシー遮蔽による処理性能向上とともに、消費電力低減がSMT採用の大きな動機であることを、2003年に開かれた組み込み系のイベント「Embedded Processor Forum」で発表していた。
3番目はともかくとして、この性能改善のためのSMTは、非常に幅広く利用されている。x86に関しては、今のところインテルだけだが、Pentium 4/Dから始まり、AtomやNehalem、2011年のSandy Bridgeでも利用される。
一方x86以外では、MIPS Technologiesの「MIPS32 74K」や、MIPS64を独自に拡張した米NetLogic社の「XLR」シリーズ、米Cavium Networkの「OCTEON」シリーズに、IBMの「Power」シリーズ、さらには最近オラクルの傘下になったサン・マイクロシステムズの「Niagara」など、特にハイエンドプロセッサーではかなり多く利用されている。
ほかにも身近なところでは、プレイステーション3に採用されている「Cell/B.E.」に搭載された「PPE」(PowerPC Processor Element)には、PowerPC 970をSMT化したものが搭載されている。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ