Fusionを見据えてSSE5を開発したAMD しかし……
さて、競合のAMDはどうしたか。AMDはAVXが発表される1年前に、「SSE5」という新しい拡張命令を発表している。2007年8月には命令セットが発表されており、エミュレーターなども提供される予定だった。特徴をざっと並べると、以下のようになる。
- レジスターは128bitのSSEレジスターをそのまま利用
- 3・4オペランド命令をサポート
- FMAC(Fused Multiply ACcumulate)命令をサポート。AVXにおけるFMAと同じように「A=B×C+D」を計算する。4オペランドを使う点もFMAと同じ
- FMACの整数演算版のIMAC(Integer Multiply ACcmulate)命令をサポート
- 並べ替えおよび条件移動命令を搭載
- ベクタ変換命令を搭載
- 精度制御・変換命令を搭載
レジスターの256bit拡張こそないものの、FMAや3・4オペランド命令の採用はAVXよりSSE5の方が先だった。そしてこのSSE5の目的は、CPUにGPUを統合する「Fusion」を念頭に置いたものだった。つまり、将来的にはGPUとCPUコアが密結合し、プログラムからはx86の拡張命令を発行しているように見えるが、実際はGPUコアが動作するようなモデルもありえることを考慮していた。
3・4オペランド命令は、こうしたGPUコアとの密結合が実現すると、使えるレジスター数がぐっと増える。なにより2オペランド的な命令セットはGPU系では一般的ではない※1。その後に登場した32bitプロセッサーは、例えばARM社なども古くから3オペランド命令をサポートしている。GPUとの連携を考えた場合、3・4オペランドフォーマットを採用するのはごく自然であっただろう。事実、2007年当時のAMDでCTO職にあったフィル・ヘスター(Phil Hester)氏ははっきりと、「SSE5は将来のFusionに到る第一歩だ」と明言していた。また、HPC(High Performance Computing)向けの性能を強化する場合、FMACの採用もごく自然な成り行きと言ってよい。
※1 そもそも、x86がなぜ2オペランドかといえば、x86命令を定義した当時はトランジスター数が厳しく、3オペランド命令を採用するのは非効率だったことに起因する。その後、使えるトランジスター数は飛躍的に増えたものの、互換性を保つという理由のみで2オペランドが継承されたためだ。
当初このSSE5は、2010年に登場する予定だった「Bulldozer」コアに搭載されるはずだった。ところがBulldozerコアの登場が予定より遅くなり、2011年以降にずれ込むことになる(関連記事)。また、SSE5を積極的に進めてきたヘスター氏が2008年4月に離職。このあたりからSSE5の雲行きが怪しくなってくる。
ひとつには、「AVXとの互換性をどうするか?」という問題であり、特にAVXで導入された新しい命令エンコード方式は、AMDにとっても魅力的だったためだ。機能的にAVXで導入される命令は、SSE5の大半を実現できるという点もあった。
また、拡張命令のソフトウェアサポートの問題もあったと思われる。インテルは拡張命令を自社でサポートできるだけのソフトウェアエンジニアと製品ラインナップを保持しているが、AMDはどうしても他社(特にWindowsプラットフォームに関してはマイクロソフト)頼みにならざるをえない。ゆえに、そちらの方から何らかのプレッシャーがかかったとしても不思議ではない。このあたりの経緯は、AMDフェロー兼シニア・アーキテクトのデイブ・クリスティ(Dave Christie)氏によるAMD Developer Blogの2009年5月6日のエントリからも多少うかがえる。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ