分岐予測、事前読込などを盛り込んだ
AMD SenseMI Technology
さて、こうした性能とは別に内部についても若干の追加説明があった。今回、“AMD SenseMI Technology”として紹介されたものは5つの特徴が含まれている。こちらについては補足資料があるので、もう少し細かく紹介したい。
まずNeural Net Predictionだ。「人工知能による分岐予測」というのは少し大げさで、実際はパーセプトロンを利用した分岐予測であることがすでに明らかにされている。
原理は最近流行しているディープラーニングと同じで、3層以上のネットワークを構築することで効果的に動作する。これは、特に履歴を増やす場合に有効で、通常の分岐予測テーブルに比べて少ないリソースで実現できる利点がある。
欠点は予測に要するレイテンシーが増えることだ。精度を上げるにはネットワークの層数を増やすのが効果的だが、層数を増やすと処理が重くなり、レイテンシーや消費電力が増える。
そこで、通常は解くべき問題、今回の場合で言えば分岐予測の精度とのバランスを取ることで層数を決めるのだが、このあたり、どの程度の規模のネットワークなのかは興味がある。
次がSmart Prefetch。これに関してはあまり詳細な話はないのだが、HotChipsにおけるスライドでも多少言及がある。
ここで"Better L1 and L2 data prefetcher"とあるあたりが若干のヒントになる程度か。もともとプリフェッチ自身は、K6以降のAMDのプロセッサーではごく当たり前のように搭載されている。特に初代APUであるLlanoでは、確か全部で10個ほどのプリフェッチユニットが搭載されていたと記憶する。
この世代は、CPU+GPUで猛烈なメモリー帯域を必要とし、その一方でメモリー自身が遅くてボトルネックになっていたため、プリフェッチを多用して限界までメモリーアクセスの効率を上げようとしていた。
しかしこの当時も、この後のKaveriの世代でもプリフェッチそのもののアーキテクチャーはパターン予測、つまりメモリーアクセスが行なわれる順を見て、次にアクセスされるであろうアドレスを予測する方式で実装されていた。
もう少し賢いコンテキスト予測(*)については「研究中だがまだ実装していない」という返事をもらった覚えがある。
したがって、断言はできないのだが“Better”というあたりは、複雑なパターンでも解釈できるようにしたか、もしくは部分的にコンテキスト予測を実装したということはありえそうだ。
(*) データの性質や分岐予測の結果などから、次にアクセスされるであろうアドレスを予測する方式。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ