HSAはAPUにのみ搭載され、
OpteronやAMD FXには搭載されない?
メモリーアドレス空間の統合は、プログラミングをする側にとっては非常に楽になる変更だ。今まではこれらも全部プログラム側が管理する必要があったが、それをシステムが代行してくれるなら、プログラミングはかなりシンプルになる。
その一方で、ハードウェア的にはかなり面倒である。CPUとGPUはまったく異なる動き方をしているし、何しろGPUはCPUより圧倒的に演算性能が高い。ということは、それだけ多くのデータをメモリーに書き出すという意味にもあり、スヌーピングの頻度も大幅に増える。このあたりを解決しないまま実装すると、CPU/GPUの両方がスヌーピングに忙殺されて、むしろ処理が遅くなることになりかねない。
具体的にどう実装するかは不明だが、Llanoの世代ではCPU~GPUの「Direct Path」を追加するだけで、結局はプロセッサー間接続まわりを再設計する羽目になったとAMD関係者から聞いた。これはかなりの複雑な処理になると思われる。
だがこうした機能は、GPUを統合しないPiledriverコアには不要、という問題がある。そのため、OpteronやAMD FX向けのコアである「Abu Dhabi」「Seoul」「Delhi」「Vishera」コアにはこの機能は搭載されず、Kaveri/Kabini/TemashといったAPU向けのコアのみに実装されることになると思われる。
前回触れた「この世代ではHSAの進歩が進み、CPUとGPUが完全なキャッシュ・コヒーレンシ(キャッシュの一貫性)を持つので、これにあわせての変更が必要になる、と筆者は理解している」という話はそのことだ。恐らくPiledriverコアのうち、1次命令/データキャッシュとCPUコアそのものは、Opteron/AMD FX向けとAPU向けでまったく同一であろうが、2次キャッシュ以降はそれぞれ別のものになるだろうと想像している。
ちなみに下のスライドは、2013年以降のソフトウェア環境をまとめたものだ。この時期はWindows 8が登場した後であるが、Windows 8そのものは、現時点ではまだ「ヘテロジニアス構成に対応」という話にはなっていない。ただし、例えばARMベースのSoCも一部のGPUがGPGPU対応になるなど、ヘテロジニアス構成に適した環境になっている。あるいはWindows 8のService Pack 1あたりでは、そうした方向にOS側が一歩進む可能性も十分に考えられる。
この連載の記事
-
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ - この連載の一覧へ