ロードマップでわかる!当世プロセッサー事情 第665回
Windowsの顔認証などで利用されているインテルの推論向けコプロセッサー「GNA」 AIプロセッサーの昨今
2022年05月02日 12時00分更新
ソフトウェアがOpenVINOに一本化された
そのGNAであるが、概略図は2017年の論文とほとんど変わっていない。ちなみに低コストと省電力が最優先なので、整数演算のみのサポートだ。Coarse-grained offloadと言うのは、それほどCPUとの連携を密にしていないということだ。おそらく、昔のWeitekのFPUと同じような形での接続(さすがにPCIe経由での割り込みくらいはサポートしているとは思いたいが)の意味かと思われる。
下の画像がもう一段細かく砕いた内部構造である。といっても肝心なところは相変わらずぼやかされているのだが、インテルの中ではGNAの核部分はCompute CoreというかCompute Tileという扱いになっており、最大2タイルが可能な構成になっているようだ。
PGD-2がオプション扱いなのはわかるが、なぜPGD-1までオプション扱いなのかが不思議。IOSFは連載173回で触れている
汎用ということで、外部バスはインテル独自のPM(Power Management) I/F以外にAXI-MやOCP-M、さらに独自データバスまでサポート。構成もAHB-T以外にIOSF(Intel On-chip System Fabric)経由をサポートするなど、自社製品以外での利用を念頭に置いたものになっているのが特徴的である。
Compute Tileは複数(少なくとも2つ)をサポートできるというのも興味深いところで、このあたりは利用するアプリケーション要件に合わせて構成を変えられるらしい。またサブシステムのレベルで言うと、μP(Micro Processor)を自由に選べるようになっているようだ。
もっとも「どの程度」自由に選べるのか、は未知数ではある。普通に考えればCortex-MシリーズのMCUがデフォルトで、オプションでRISC-Vなども選べるという感じだろうか。さすがにもうQuarkは選択肢に入っていないと信じたい。
2017年の論文での説明と一番異なるのはソフトウェア部分だろうか。先に書いたように以前はIntel Deep Learning SDK Deployment ToolやDeep Learning SDK Inference Engine、それとGNA native libraryでのサポートとなっていたが、製品版ではこれがOpenVINOに一本化された。
現在のインテルの方向性を考えればこれが一番妥当であるし、今後GNAが大きく変わってもOpenVINOレベルでの互換性が取れていればスムーズに移行させやすいことを考えれば妥当な選択だろう。
連載657回で説明したが、インテルはMeteor Lake世代でMyriad Xないしその次のバージョンのAIプロセッサーを搭載する方向である。
これを受けて筆者はGNAがこのMyriad Xないしその後継製品で代替されるのかも、と考えていたのだが、この説明を読むとなんだか両立しそうである。Clover Fallsのような用途に使うにはMyriad Xは性能と消費電力のどちらも高すぎる。引き続きGNAはEdge of the edge向けとしてクライアントCPUに統合され続け、それとは別にMyriad系列が新たにVPUとして追加される、というのが一番ありそうな感じに見えてきた。
ついでに言えばGNA自身はSoft IPであり、しかも複数のホストに接続可能なI/Fを用意しているあたりは、Intel Foundry Service経由でのIP提供も考えている可能性が非常に高い。これがどこまでIPビジネスとして成立するのかは未知数ではある。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第870回
PC
スマホCPUの王者が挑む「脱・裏方」宣言。Arm初の自社販売チップAGI CPUは世界をどう変えるか? -
第869回
PC
半導体プロセスの新たな覇権! インテルのDNNプロセッサーはAMDやMetaを凌駕する配線密度と演算密度 -
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 -
第864回
PC
なぜAMDはチップレットで勝利したのか? 2万ドルのウェハーから逆算する経済的合理性 -
第863回
PC
銅配線はなぜ限界なのか? ルテニウムへの移行で変わる半導体製造の常識と課題 -
第862回
PC
「ビル100階建て相当」の超難工事! DRAM微細化が限界を超え前人未到の垂直化へ突入 -
第861回
PC
INT4量子化+高度な電圧管理で消費電力60%削減かつ90%性能アップ! Snapdragon X2 Eliteの最先端技術を解説 -
第860回
PC
NVIDIAのVeraとRubinはPCIe Gen6対応、176スレッドの新アーキテクチャー搭載! 最高クラスの性能でAI開発を革新 - この連載の一覧へ













