今後はXilinxのリソースを使って
AIアクセラレーターを統合する予定
製品としてのRyzen 7000シリーズの特徴はここまで紹介してきたことですべてだが、製品ラインナップとしては5nm世代でZen 4とZen 4+3D V-Cache、それとZen 4ベースのRyzen Threadripperが用意されているという話であった。
先にZen 4世代は5nmと4nmという話が出ていたが、デスクトップは5nmのままで推移することになる。では4nmは? というと、モバイル向けとなる。次世代のモバイルはZen 4コアとRDNA3、それにAIEを搭載し、4nmで製造されることになる。

モバイル向けロードマップ。余談だがTSMCはRibbon FETを採用した2nmプロセスの製造を2025年に始めるとしており、順序から言うとZen 5の次は2nmが視野に入るのだが、2025年はスマートフォン(というよりApple)と取り合いになるのが見えているだけに、どうするのか気になるところだ
その次のStrix Ppintは、Zen 5にRDNA3+、それにAIEを搭載する。先のPapermaster氏のCPUコアのロードマップ(2ページ目最初の画像)と照らし合わせると、このStrix Pointはおそらく3nmプロセスで製造されることになるだろう。
ところでここまで出てきたAIEとはなにか? という話だが、これはAI Engineの略である。前のページのZen 5に関するスライドに出てきた“Integrated AI and Machine Learning optimization”の正体がこれである。このAI Engine、もともとはAMDが買収したXilinxが2019年から出荷しているVersal ACAP(Adaptive Compute Acceleration Platform)で実装されているものである。
ACAPというのはFPGAの次のアーキテクチャーとして位置づけられているもので、「Versal ACAPというFPGA」と書くと怒られてしまうものだが、それはともかく。これはなにか? というとVLIWベースの演算エンジンの塊である。こちらは詳細が公開されているので、いずれAIプロセッサー連載の方で紹介する。
Versalという製品は6つのファミリーがあり、うち5つがすでに出荷中であるが、このうちVersal AI CoreとVersal AI Edgeという2つのファミリーにこのAIプロセッサーが搭載されている。
ちなみにハイエンドであるVersal AI Coreの場合、AI Engineが最大400個、またはAI Engine-MLが最大304個搭載され、これとは別にDSPが最大1968個やFPGA LUT(Xilinx用語ではLogic Cell)が158万6000個搭載されるなど猛烈な演算処理性能を持っている。で、Xilinx買収後にAMDはこのAI周りに関して新しい戦略を立てた。それがXDNAである。
現状AMDは、Ryzen/EPYCは基本的にAI処理機能は装備されていない。RDNA/CNDAに関してはROCm経由でいくつかのAIフレームワークをサポート。一方XilinxベースのFPGAはVersal AI Core/Edge以外はAI用エンジンは搭載されていない感じで、まったくソフトウェアの共通性がない。
そこでまず、おそらくZen 4/RDNA3/CDNA3の世代に向けて、まずUnified AI Stack 1.0をリリースする。ただこの時点ではまだ上に皮を被せただけで、内部の共通化には至っていない。

Xilinxの買収は今年2月に完了したので、さすがにデスクトップのRyzen 7000シリーズには間に合わない。なので最初の搭載はモバイル向けのPhoenix Pointであり、すべてのCPUに入るのはZen 5世代からということになる
これがもう少し共通化が進むのは、Zen 5世代に投入されると思われるUnified AI Stack 2.0になる形だ。この頃になると、CPUとVersalで共通のAI Engineを搭載しており、これをベースに高効率にAI/MLの処理が出来るというのがAMDの目標と思われる。
この構図は、インテルがAI関連のソフトウェアAPIをOpenVINOとしてまとめ、さらにこれをoneDNN(oneAPI Deep Neural Network Library)として高レベルでまとめたのによく似ている。おそらくUnified AI Stack 1.0の段階でVNNIがサポートされ、2.0ではVNNIとAI Engineの両対応になると思われる。
単にCPUコアの更新だけでなく、Xilinxのリソースを使ってAIアクセラレーターまで統合する計画が明確に示されたのが今回のロードマップだったと言える。

この連載の記事
-
第813回
PC
Granite Rapid-DことXeon 6 SoCを12製品発表、HCCとXCCの2種類が存在する インテル CPUロードマップ -
第812回
PC
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC IEDM 2024レポート -
第811回
PC
Panther Lakeを2025年後半、Nova Lakeを2026年に投入 インテル CPUロードマップ -
第810回
PC
2nmプロセスのN2がTSMCで今年量産開始 IEDM 2024レポート -
第809回
PC
銅配線をルテニウム配線に変えると抵抗を25%削減できる IEDM 2024レポート -
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート - この連載の一覧へ