今後はXilinxのリソースを使って
AIアクセラレーターを統合する予定
製品としてのRyzen 7000シリーズの特徴はここまで紹介してきたことですべてだが、製品ラインナップとしては5nm世代でZen 4とZen 4+3D V-Cache、それとZen 4ベースのRyzen Threadripperが用意されているという話であった。
先にZen 4世代は5nmと4nmという話が出ていたが、デスクトップは5nmのままで推移することになる。では4nmは? というと、モバイル向けとなる。次世代のモバイルはZen 4コアとRDNA3、それにAIEを搭載し、4nmで製造されることになる。
その次のStrix Ppintは、Zen 5にRDNA3+、それにAIEを搭載する。先のPapermaster氏のCPUコアのロードマップ(2ページ目最初の画像)と照らし合わせると、このStrix Pointはおそらく3nmプロセスで製造されることになるだろう。
ところでここまで出てきたAIEとはなにか? という話だが、これはAI Engineの略である。前のページのZen 5に関するスライドに出てきた“Integrated AI and Machine Learning optimization”の正体がこれである。このAI Engine、もともとはAMDが買収したXilinxが2019年から出荷しているVersal ACAP(Adaptive Compute Acceleration Platform)で実装されているものである。
ACAPというのはFPGAの次のアーキテクチャーとして位置づけられているもので、「Versal ACAPというFPGA」と書くと怒られてしまうものだが、それはともかく。これはなにか? というとVLIWベースの演算エンジンの塊である。こちらは詳細が公開されているので、いずれAIプロセッサー連載の方で紹介する。
Versalという製品は6つのファミリーがあり、うち5つがすでに出荷中であるが、このうちVersal AI CoreとVersal AI Edgeという2つのファミリーにこのAIプロセッサーが搭載されている。
ちなみにハイエンドであるVersal AI Coreの場合、AI Engineが最大400個、またはAI Engine-MLが最大304個搭載され、これとは別にDSPが最大1968個やFPGA LUT(Xilinx用語ではLogic Cell)が158万6000個搭載されるなど猛烈な演算処理性能を持っている。で、Xilinx買収後にAMDはこのAI周りに関して新しい戦略を立てた。それがXDNAである。
現状AMDは、Ryzen/EPYCは基本的にAI処理機能は装備されていない。RDNA/CNDAに関してはROCm経由でいくつかのAIフレームワークをサポート。一方XilinxベースのFPGAはVersal AI Core/Edge以外はAI用エンジンは搭載されていない感じで、まったくソフトウェアの共通性がない。
そこでまず、おそらくZen 4/RDNA3/CDNA3の世代に向けて、まずUnified AI Stack 1.0をリリースする。ただこの時点ではまだ上に皮を被せただけで、内部の共通化には至っていない。
これがもう少し共通化が進むのは、Zen 5世代に投入されると思われるUnified AI Stack 2.0になる形だ。この頃になると、CPUとVersalで共通のAI Engineを搭載しており、これをベースに高効率にAI/MLの処理が出来るというのがAMDの目標と思われる。
この構図は、インテルがAI関連のソフトウェアAPIをOpenVINOとしてまとめ、さらにこれをoneDNN(oneAPI Deep Neural Network Library)として高レベルでまとめたのによく似ている。おそらくUnified AI Stack 1.0の段階でVNNIがサポートされ、2.0ではVNNIとAI Engineの両対応になると思われる。
単にCPUコアの更新だけでなく、Xilinxのリソースを使ってAIアクセラレーターまで統合する計画が明確に示されたのが今回のロードマップだったと言える。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ