今後はXilinxのリソースを使って
AIアクセラレーターを統合する予定
製品としてのRyzen 7000シリーズの特徴はここまで紹介してきたことですべてだが、製品ラインナップとしては5nm世代でZen 4とZen 4+3D V-Cache、それとZen 4ベースのRyzen Threadripperが用意されているという話であった。
先にZen 4世代は5nmと4nmという話が出ていたが、デスクトップは5nmのままで推移することになる。では4nmは? というと、モバイル向けとなる。次世代のモバイルはZen 4コアとRDNA3、それにAIEを搭載し、4nmで製造されることになる。
その次のStrix Ppintは、Zen 5にRDNA3+、それにAIEを搭載する。先のPapermaster氏のCPUコアのロードマップ(2ページ目最初の画像)と照らし合わせると、このStrix Pointはおそらく3nmプロセスで製造されることになるだろう。
ところでここまで出てきたAIEとはなにか? という話だが、これはAI Engineの略である。前のページのZen 5に関するスライドに出てきた“Integrated AI and Machine Learning optimization”の正体がこれである。このAI Engine、もともとはAMDが買収したXilinxが2019年から出荷しているVersal ACAP(Adaptive Compute Acceleration Platform)で実装されているものである。
ACAPというのはFPGAの次のアーキテクチャーとして位置づけられているもので、「Versal ACAPというFPGA」と書くと怒られてしまうものだが、それはともかく。これはなにか? というとVLIWベースの演算エンジンの塊である。こちらは詳細が公開されているので、いずれAIプロセッサー連載の方で紹介する。
Versalという製品は6つのファミリーがあり、うち5つがすでに出荷中であるが、このうちVersal AI CoreとVersal AI Edgeという2つのファミリーにこのAIプロセッサーが搭載されている。
ちなみにハイエンドであるVersal AI Coreの場合、AI Engineが最大400個、またはAI Engine-MLが最大304個搭載され、これとは別にDSPが最大1968個やFPGA LUT(Xilinx用語ではLogic Cell)が158万6000個搭載されるなど猛烈な演算処理性能を持っている。で、Xilinx買収後にAMDはこのAI周りに関して新しい戦略を立てた。それがXDNAである。
現状AMDは、Ryzen/EPYCは基本的にAI処理機能は装備されていない。RDNA/CNDAに関してはROCm経由でいくつかのAIフレームワークをサポート。一方XilinxベースのFPGAはVersal AI Core/Edge以外はAI用エンジンは搭載されていない感じで、まったくソフトウェアの共通性がない。
そこでまず、おそらくZen 4/RDNA3/CDNA3の世代に向けて、まずUnified AI Stack 1.0をリリースする。ただこの時点ではまだ上に皮を被せただけで、内部の共通化には至っていない。
これがもう少し共通化が進むのは、Zen 5世代に投入されると思われるUnified AI Stack 2.0になる形だ。この頃になると、CPUとVersalで共通のAI Engineを搭載しており、これをベースに高効率にAI/MLの処理が出来るというのがAMDの目標と思われる。
この構図は、インテルがAI関連のソフトウェアAPIをOpenVINOとしてまとめ、さらにこれをoneDNN(oneAPI Deep Neural Network Library)として高レベルでまとめたのによく似ている。おそらくUnified AI Stack 1.0の段階でVNNIがサポートされ、2.0ではVNNIとAI Engineの両対応になると思われる。
単にCPUコアの更新だけでなく、Xilinxのリソースを使ってAIアクセラレーターまで統合する計画が明確に示されたのが今回のロードマップだったと言える。
この連載の記事
-
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 - この連載の一覧へ