このページの本文へ

前へ 1 2 3 次へ

ロードマップでわかる!当世プロセッサー事情 第859回

組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現

2026年01月19日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

搭載するNPUはVersal AI Edge Gen2とほぼ同じ

 Ryzen AI Embeddedが特徴的なのは、すでに出荷されているVersal AI Edge Gen2と同じNPU(Versal AIはAI Engineと称している)が搭載されていることだ。Versal AIのAI Engineは現在第3世代となっている。第1世代はVersal ACAPに搭載されたもので、連載674回で紹介している。

 この時のAI Engineはまだターゲットが絞り切れていなかったというか、そもそもの基本設計が2018年以前のもので、エッジ向けというよりもAI向け汎用といったものだった。これをVersal AIにエッジAI向けとなるVersal AI Edgeが追加されたときに、このAI Engineも内部を多少改良している。これがRyzen 7000シリーズに搭載された初代Ryzen AIである

 Versal AI Edgeは2024年にVersal AI Edge Gen2に進化するが、この際にAI Engineも大幅に強化された。強化されたAI Engineの構造がそのままNPUとしてRyzen AI 300シリーズに搭載されているわけで、AI Engineに関してはVersal AI Edge Gen2とRyzen AI Embeddedはほぼ同じである。AMDに確認したところ、両方で同じNPU用のプログラムが動作するという回答を得ている。

 動作周波数やコア数などは異なるが、Versal AI Edge Gen2自身がそもそも複数のSKUがあり、AI Engineも最小構成24タイル~最大構成144タイルと6倍もの差があり、INT 8での推論性能は31~184TOPSとなっている。したがって既存のアプリケーションは構成が変化することを織り込んでおり、50TOPSのRyzen AI Embedded上で動作させることにそれほどの困難がない。

 当たり前だが、プログラムが共通というのは「同じネットワークがそのまま動作する」という意味であり、バイナリーそのものに互換性があるわけではない。そもそもRyzen AI Embeddedはx86(x64)バイナリーとして構成され、一方Versal AI EdgeはFPGA FabricのBitstreamの中にAI Engine用のバイナリーやCPU(Cortex-A78AEやCortex-R52を複数個搭載する)用のバイナリーを含む形で構成されるため、それぞれ別々にビルドする必要がある。

 ただ昨今の組み込み系の機器の場合、Edge AIからPhysical AIといったトレンドに徐々に対応が進んでいる。これまでだとセンサー入力を基に内部で計算などを行ない、その結果を基に出力する(例えば温度センサーとヒーターを連動させる、回転数センサーや振動センサーを連携させてモーターを制御するなど)方式だったのが、入力センサーをAIに突っ込み、その結果を基に出力制御するといったものだ。

 今回の場合、ローエンドのシステムはRyzen AI Embedded、ハイエンドのシステムはVersal AI Edge Gen2で構成しても、内部のプログラムの核となる部分に手を付けずに移行が可能、という新しい可能性をEmbedded向けにもたらす組み合わせになるわけで、このあたりがAlteraを捨てたインテルと、そもそもGPUしかもっていないNVIDIAとの大きな差別化要因になる可能性がある。

 実際ユースケースなどを見ると、AI推論が必要なエントリー向けにP100シリーズが最適、という形の提案をしており、より高度な性能が必要な場合は今後登場するP100の上位、あるいはX100シリーズか、より高い性能(絶対処理性能というよりも、レスポンス時間の短縮など)が必要ならVersal AI Edgeが使えるという提案の仕方ができるようになったことがうかがえる。

自動車のコクピット。あくまで計器パネルと、簡単な機能安全(運転手監視)程度がRyzen AI Embeddedで現状こなせる限界であり、それ以上は無理だろう

産業機器の管理システム。最近はHeadless(自分では液晶パネルを持たず、作業員の持つタブレッドなどに画面を飛ばす仕組み。WebGLなどを使う)機器も増えてきたが、その場合でもRDNA 3.5の描画性能は効くだろう

 ちなみに自動車と産業機器以外の用途として提案されているのが下の画像で、わりと広範に利用できるとしている。

Versal AI Edgeも4コアのMali-G78AEを搭載するが、絶対的な描画性能ではRDNA 3.5の方が上で、それもあって高いGPU能力が必要そうな用途に向くとする

 少し気になるのがS/Wのサポート。先程ROCmに言及したが、Ryzen AI Embedded P100ではROCm Softwareがちゃんとサポートされる。なのだが脚注を見ると、「4~6コアのP100シリーズでは、算術演算とSP(Special Function:特殊演算)のみサポートされ、AIその他のワークロードはより高いコア数のCPUでサポートされる」となっている。

Ryzen AI Embedded P100ではROCm Softwareをサポートする。ただしAI Frameworkそのものは動作するわけで、これはおそらくCPU+GPUで動作する形になるのだろう。NPUの存在意義はどこにあるのか?

 これを見ると、Krackan PointとStrix PointではNPU周りの実装が異なっており、ROCmを実行できないなにか問題があるのかも? という気になってくる。このあたり、AMDに事情を聞きそこなったので詳細は不明なのだが、次回機会があったら確認しておきたい。

 そのRyzen AI Embedded P100はすでにドキュメント/開発ツールとサンプル、開発ボードのサンプルは入手可能になっており、製品量産は今年第2四半期、量産向けのリファレンスボード(必要なら最終製品に組み込める品質のボード)の出荷は今年後半とされている。

6コアを超えるP100は今年前半中というので、おそらく第2四半期あたりにサンプルが出てきて、X100シリーズは第3四半期以降になるだろう

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事