分岐予測、事前読込などを盛り込んだ
AMD SenseMI Technology
さて、こうした性能とは別に内部についても若干の追加説明があった。今回、“AMD SenseMI Technology”として紹介されたものは5つの特徴が含まれている。こちらについては補足資料があるので、もう少し細かく紹介したい。
まずNeural Net Predictionだ。「人工知能による分岐予測」というのは少し大げさで、実際はパーセプトロンを利用した分岐予測であることがすでに明らかにされている。
原理は最近流行しているディープラーニングと同じで、3層以上のネットワークを構築することで効果的に動作する。これは、特に履歴を増やす場合に有効で、通常の分岐予測テーブルに比べて少ないリソースで実現できる利点がある。
欠点は予測に要するレイテンシーが増えることだ。精度を上げるにはネットワークの層数を増やすのが効果的だが、層数を増やすと処理が重くなり、レイテンシーや消費電力が増える。
そこで、通常は解くべき問題、今回の場合で言えば分岐予測の精度とのバランスを取ることで層数を決めるのだが、このあたり、どの程度の規模のネットワークなのかは興味がある。
次がSmart Prefetch。これに関してはあまり詳細な話はないのだが、HotChipsにおけるスライドでも多少言及がある。
ここで"Better L1 and L2 data prefetcher"とあるあたりが若干のヒントになる程度か。もともとプリフェッチ自身は、K6以降のAMDのプロセッサーではごく当たり前のように搭載されている。特に初代APUであるLlanoでは、確か全部で10個ほどのプリフェッチユニットが搭載されていたと記憶する。
この世代は、CPU+GPUで猛烈なメモリー帯域を必要とし、その一方でメモリー自身が遅くてボトルネックになっていたため、プリフェッチを多用して限界までメモリーアクセスの効率を上げようとしていた。
しかしこの当時も、この後のKaveriの世代でもプリフェッチそのもののアーキテクチャーはパターン予測、つまりメモリーアクセスが行なわれる順を見て、次にアクセスされるであろうアドレスを予測する方式で実装されていた。
もう少し賢いコンテキスト予測(*)については「研究中だがまだ実装していない」という返事をもらった覚えがある。
したがって、断言はできないのだが“Better”というあたりは、複雑なパターンでも解釈できるようにしたか、もしくは部分的にコンテキスト予測を実装したということはありえそうだ。
(*) データの性質や分岐予測の結果などから、次にアクセスされるであろうアドレスを予測する方式。

この連載の記事
-
第814回
PC
インテルがチップレット接続の標準化を画策、小さなチップレットを多数つなげて性能向上を目指す インテル CPUロードマップ -
第813回
PC
Granite Rapid-DことXeon 6 SoCを12製品発表、HCCとXCCの2種類が存在する インテル CPUロードマップ -
第812回
PC
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC IEDM 2024レポート -
第811回
PC
Panther Lakeを2025年後半、Nova Lakeを2026年に投入 インテル CPUロードマップ -
第810回
PC
2nmプロセスのN2がTSMCで今年量産開始 IEDM 2024レポート -
第809回
PC
銅配線をルテニウム配線に変えると抵抗を25%削減できる IEDM 2024レポート -
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート - この連載の一覧へ