今後はXilinxのリソースを使って
AIアクセラレーターを統合する予定
製品としてのRyzen 7000シリーズの特徴はここまで紹介してきたことですべてだが、製品ラインナップとしては5nm世代でZen 4とZen 4+3D V-Cache、それとZen 4ベースのRyzen Threadripperが用意されているという話であった。
先にZen 4世代は5nmと4nmという話が出ていたが、デスクトップは5nmのままで推移することになる。では4nmは? というと、モバイル向けとなる。次世代のモバイルはZen 4コアとRDNA3、それにAIEを搭載し、4nmで製造されることになる。
モバイル向けロードマップ。余談だがTSMCはRibbon FETを採用した2nmプロセスの製造を2025年に始めるとしており、順序から言うとZen 5の次は2nmが視野に入るのだが、2025年はスマートフォン(というよりApple)と取り合いになるのが見えているだけに、どうするのか気になるところだ
その次のStrix Ppintは、Zen 5にRDNA3+、それにAIEを搭載する。先のPapermaster氏のCPUコアのロードマップ(2ページ目最初の画像)と照らし合わせると、このStrix Pointはおそらく3nmプロセスで製造されることになるだろう。
ところでここまで出てきたAIEとはなにか? という話だが、これはAI Engineの略である。前のページのZen 5に関するスライドに出てきた“Integrated AI and Machine Learning optimization”の正体がこれである。このAI Engine、もともとはAMDが買収したXilinxが2019年から出荷しているVersal ACAP(Adaptive Compute Acceleration Platform)で実装されているものである。
ACAPというのはFPGAの次のアーキテクチャーとして位置づけられているもので、「Versal ACAPというFPGA」と書くと怒られてしまうものだが、それはともかく。これはなにか? というとVLIWベースの演算エンジンの塊である。こちらは詳細が公開されているので、いずれAIプロセッサー連載の方で紹介する。
Versalという製品は6つのファミリーがあり、うち5つがすでに出荷中であるが、このうちVersal AI CoreとVersal AI Edgeという2つのファミリーにこのAIプロセッサーが搭載されている。
ちなみにハイエンドであるVersal AI Coreの場合、AI Engineが最大400個、またはAI Engine-MLが最大304個搭載され、これとは別にDSPが最大1968個やFPGA LUT(Xilinx用語ではLogic Cell)が158万6000個搭載されるなど猛烈な演算処理性能を持っている。で、Xilinx買収後にAMDはこのAI周りに関して新しい戦略を立てた。それがXDNAである。
現状AMDは、Ryzen/EPYCは基本的にAI処理機能は装備されていない。RDNA/CNDAに関してはROCm経由でいくつかのAIフレームワークをサポート。一方XilinxベースのFPGAはVersal AI Core/Edge以外はAI用エンジンは搭載されていない感じで、まったくソフトウェアの共通性がない。
そこでまず、おそらくZen 4/RDNA3/CDNA3の世代に向けて、まずUnified AI Stack 1.0をリリースする。ただこの時点ではまだ上に皮を被せただけで、内部の共通化には至っていない。
Xilinxの買収は今年2月に完了したので、さすがにデスクトップのRyzen 7000シリーズには間に合わない。なので最初の搭載はモバイル向けのPhoenix Pointであり、すべてのCPUに入るのはZen 5世代からということになる
これがもう少し共通化が進むのは、Zen 5世代に投入されると思われるUnified AI Stack 2.0になる形だ。この頃になると、CPUとVersalで共通のAI Engineを搭載しており、これをベースに高効率にAI/MLの処理が出来るというのがAMDの目標と思われる。
この構図は、インテルがAI関連のソフトウェアAPIをOpenVINOとしてまとめ、さらにこれをoneDNN(oneAPI Deep Neural Network Library)として高レベルでまとめたのによく似ている。おそらくUnified AI Stack 1.0の段階でVNNIがサポートされ、2.0ではVNNIとAI Engineの両対応になると思われる。
単にCPUコアの更新だけでなく、Xilinxのリソースを使ってAIアクセラレーターまで統合する計画が明確に示されたのが今回のロードマップだったと言える。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ




