Zen 5に搭載するAIエンジンのベースとなったXilinxの「Everest」　AIプロセッサーの昨今

2022年07月04日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

SW PEの内部構造はMIMD

　ではそのSW PEはどんな構造か？　というのが下の画像だ。ラフに言えば1つのSW PEのエレメント(ここではTileという表現になっている)は、演算器とローカルメモリーを組み合わせた構成である。で、これが格子状に多数、メッシュ構造で接続されているという格好である。

SW PEの構造。この頃はまだ5Gなどに向けたアクセラレーターも前面に打ち出していた関係で、1つのISAの下にAI向けの拡張とワイヤレス向け拡張があるような構造として説明されていた

ちなみに最初の搭載製品であるVersal AI Coreの場合、最大でこのSW PEを400個搭載していた

　メッシュ構造にした上で、それぞれのSW PEを連結することで、処理のパイプラインを構築することもできる。

これはいわゆるデータフロー式の処理のやり方、と見なすこともできる

　要するにこのSW PEはMIMD構成になっているわけだ。おのおののSW PEは別々の命令を実行可能であり、処理の内容に応じて複数のPEを組み合わせて最適な形で実行可能である。もちろん同一の命令を実行することもできるが、その場合はそれぞれのSW PEに同じプログラムをロードして、同時に実行させるという話であって、その意味ではSIMDとは異なる。

　ちなみにこの割り振りはプログラマブルであり(つまり自動では行なわれない)、プログラマー側で考える必要があるが、結果から言えばこれはVitis AIと呼ばれるツールで割り振りを管理できるので、実はそれほど難しいことではない。

　これまでの画像は2018年8月に開催されたHotChipsでの説明であり、この時はまだSW PEの中身の詳しいところは未公開だったが、同年10月に開催されたXDF(Xilinx Developer Forum) 2018の開催に合わせてホワイトペーパーがリリースされ、これでもう少し細かい話が見えてきた。

　まずSW PEあらためAI Engineという名前になったブロックの内部構造が下の画像だ。RISC風の32bit演算ユニットに、Fixed Pointの512bit SIMDエンジンとFloating Pointの512bit SIMDエンジンを組み合わせるという独特の構造である。プログラムメモリーは16KB、データメモリ－は32KBと決して大きくないが、これは逆に言えば1つのAI Engineであまり複雑な処理をさせるつもりがない、という裏返しでもある。

AI Engineの内部構造。外部入出力がかなり豊富なのも特徴である。2次元メッシュなので、東西(AXIS East/West)と南北(AXIS North/South)方向のルーターが用意され、中央にAXIM Switchという形でこの2次元メッシュとのI/Fが搭載されている(黄色の部分)

　さて、SIMDエンジンは、別にRISCユニットから呼び出されるわけではない。というのは、このAI Engineの命令フォーマットは下の画像ようにVLIWになっている。

ここでは“One Vector Multiplication”とあるが、別にベクトル乗算だけでなく、他の演算も可能。あくまでVector Operationの一例、というだけである

　RISCユニットは同時2命令実行の構成で、他にロード×2、ベクトル演算×1、ストアー×1で同時6命令が実行可能、ということになっている。ただここで言う“Instruction”と、いわゆるOpsとはまた別らしい。というのは、2019年のHotChipsでは、下の画像が公開されている。

2019年のHotChipsで公開された内部構造。そもそもこの図で、Load/Store UnitがVector Registerに対してだけしか動かないのか、Scalar/Vector両対応なのかがよくわからないのだが、あるいはVector Load/StoreとScalar Load/Storeは別に数えているのかもしれない

　このことから、以下のどちらか(あるいはこれ以外のなにか)の数え方をしているのではないかと思われる。

実はRISCプロセッサーの中で命令変換がかかっており、2つのRISC命令が実際には3～4個の内部命令(Ops)に分解されて実施されている
Vectorプロセッサーでは、型変換(vec128int8/vec8fp32)が自動的に行なわれ、これを加味すると7～8命令相当になる

　ここでVectorユニットは浮動小数点と固定小数点の両方が同時に動くことは基本的に考慮されていないと思われる。というのはAI/機械学習向けは浮動小数点を使うことがほとんどで、一方5Gを始めとする無線向けでは以前からDSPなどで固定小数点が利用されており、これに向けた格好である。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

AMD記事アクセスランキング

お勧めのAMD記事

sponsored
2026年03月07日更新

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する
sponsored
2026年02月19日更新

今買うべきAMD Ryzen 7 9850X3D搭載BTOパソコンおすすめ8選！
自作PC
2026年01月28日更新

「Ryzen 7 9850X3D」速攻検証：クロックが400MHz上がった以上の価値を見いだせるか？
デジタル
2026年01月19日更新

組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現
デジタル
2026年01月12日更新

CES 2026で実機を披露！ AMDが発表した最先端AIラックHeliosの最新仕様を独自解説

AMD

Zen 5に搭載するAIエンジンのベースとなったXilinxの「Everest」　AIプロセッサーの昨今

SW PEの内部構造はMIMD

この連載の記事

デジタル
Zen 4は5nmと4nmを投入、Zen 5では3nmプロセスに　AMD CPUロードマップ

PC
ロードマップでわかる！当世プロセッサー事情（目次）

デジタル
AMD XILINX、最大32×1080p60のエンコードを同時に行なえるアクセラレーターカード「Alveo MA35D」を発表

デジタル
Ryzen Pro 7000シリーズを発表、Ryzen AIはWindows 11で対応済み　AMD CPUロードマップ

ビジネス
AIアクセラレータも内蔵、AMDがビジネスPC向け「Ryzen PRO」最新版を紹介

デジタル
AMD、リサ・スーCEOが経済産業省主催意見交換会に参加

AMD記事アクセスランキング

お勧めのAMD記事

AMDのゲームテクノロジーセット「FSR “Redstone”」解説。新GPUが出なくてもソフトは劇的に進化する

今買うべきAMD Ryzen 7 9850X3D搭載BTOパソコンおすすめ8選！

「Ryzen 7 9850X3D」速攻検証：クロックが400MHz上がった以上の価値を見いだせるか？

組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現

CES 2026で実機を披露！ AMDが発表した最先端AIラックHeliosの最新仕様を独自解説

Sponsored Articles

西日本最大のPC市場、大阪日本橋で売れ筋のAMD系PCパーツを大調査！

プロフェッショナルへ捧ぐ“怪物”―AMD Ryzen Threadripper 9000シリーズ搭載PC、国内BTOメーカーから一挙集結

AMDならこれが買い！ PCパーツメーカーが選ぶオススメ3選～ASUS編～

AMDならこれが買い！ PCパーツメーカーが選ぶオススメ3選～MSI編～

Zen 5に搭載するAIエンジンのベースとなったXilinxの「Everest」 AIプロセッサーの昨今

SW PEの内部構造はMIMD

この連載の記事

この記事の編集者は以下の記事をオススメしています

デジタル Zen 4は5nmと4nmを投入、Zen 5では3nmプロセスに AMD CPUロードマップ

PC ロードマップでわかる！当世プロセッサー事情（目次）

デジタル AMD XILINX、最大32×1080p60のエンコードを同時に行なえるアクセラレーターカード「Alveo MA35D」を発表

デジタル Ryzen Pro 7000シリーズを発表、Ryzen AIはWindows 11で対応済み AMD CPUロードマップ

ビジネス AIアクセラレータも内蔵、AMDがビジネスPC向け「Ryzen PRO」最新版を紹介

デジタル AMD、リサ・スーCEOが経済産業省主催 意見交換会に参加

AMD記事アクセスランキング

お勧めのAMD記事

Sponsored Articles

Zen 5に搭載するAIエンジンのベースとなったXilinxの「Everest」　AIプロセッサーの昨今

デジタル
Zen 4は5nmと4nmを投入、Zen 5では3nmプロセスに　AMD CPUロードマップ

PC
ロードマップでわかる！当世プロセッサー事情（目次）

デジタル
AMD XILINX、最大32×1080p60のエンコードを同時に行なえるアクセラレーターカード「Alveo MA35D」を発表

デジタル
Ryzen Pro 7000シリーズを発表、Ryzen AIはWindows 11で対応済み　AMD CPUロードマップ

ビジネス
AIアクセラレータも内蔵、AMDがビジネスPC向け「Ryzen PRO」最新版を紹介

デジタル
AMD、リサ・スーCEOが経済産業省主催意見交換会に参加