新たなIoT向け64ビットCPU+NPUで、10億パラメーター(1B)以上のAIモデルをオンデバイス処理可能に
IoTデバイスでも生成AIを実行へ 「Armv9」ベースのエッジAIプラットフォーム発表
2025年02月27日 01時00分更新
英Arm(アーム)は2025年2月27日、Armv9アーキテクチャベースでは初めてとなる、IoT向けに最適化された“エッジAIプラットフォーム”を発表した。IoT向けの新しい64ビットCPU「Arm Cortex-A320」と昨年発表したAIアクセラレーター(NPU)「Arm Ethos-U85」を組み合わせた構成で、10億パラメーター以上のAIモデルをオンデバイスで実行できるようになるという。
この発表に合わせて、AIフレームワーク開発者向けライブラリ「Arm Kleidi(クレイディ)」をIoT向けの同プラットフォームに拡張することも発表された。記者説明会では、前世代(Armv8アーキテクチャ)比での高いAI処理パフォーマンスやセキュリティ、Armv9エコシステムとの互換性などがアピールされた。
「適切な場所でAIワークロードを実行させることが重要になってきた」
あいさつに立ったArm日本法人社長の横山崇幸氏は、「AI革命をさらに前進させようとしている中、そしてIoTワークロードがますます複雑になる中で、“適切な場所で適切なAIワークロードを実行する”ことが重要になってきている」と、エッジAIが必要性となる背景を説明。今回の発表は、より多くのAI演算をより低消費電力のデバイスで実行できるような、シンプルかつセキュアで、柔軟性の高いAI開発を実現するものだと述べた。
今回発表されたエッジAIプラットフォームを構成するCortex-A320 CPUは、Armv9アーキテクチャのCPUシリーズでは最小モデルとなり、高い効率性を特徴としている。
Arm日本法人で応用技術部ディレクターを務める中島理志氏は、「A320は、Armv9ラインの強力なソフトウェアエコシステムと、64ビットアーキテクチャの拡張性を持ちながら、エッジAI向けにパイプラインをフルスクラッチで作り直したことで、よりエネルギー効率の高いプロセッサーになっている」と説明する。
A320は、ほかのArmv9シリーズCPUと同様に、新しい「SVE2(Scalable Vector Extension)」や「Matrix Multiply Instructions」といったAI向け命令セット、また「Memory Tagging Extension」などのセキュリティ向け命令セットに対応する。これにより、前世代CPU(Armv8のCortex-A35、A520)との比較で、AI/機械学習パフォーマンスは10倍、電力効率は最大50%、整数演算パフォーマンスは最大30%向上しているという。
さらに、昨年発表したソフトウェアライブラリ「Arm KeidiAI」が、CPU上でのAI処理を最適化する。中島氏は、KleidiAIの適用によって、非適用時と比較して最大70%のパフォーマンス向上が実現すると説明する。
こうした特徴により、今回のエッジAIプラットフォームでは、サーバーやスマートフォンと比べて消費電力の制約が大幅に厳しいIoT領域においても、より高度なAI処理を実現する。

適用領域のイメージとして、スマートウオッチやスマートウェアラブルデバイスなどを挙げた。また、サーバー向けArmv9 CPUと同じセキュリティ機能を備えるため、中島氏は「一気通貫でセキュリティが担保できるメリットもある」と説明した
Transformerモデル対応のため、メモリ“4GBの壁”打破も
もうひとつのポイントが「64ビット化」だ。この点については、過去1、2年の間にAI技術が急速に進化し、「生成AIのIoT端末への実装」という新たなニーズが生まれていることに対応するものだと、中島氏は説明する。
2022年に発表したCortex-M85(Armv8)は、DSPエンジンの「Arm Helium」を搭載しており、Ethos NPUの組み合わせによって、画像認識などCNN(畳み込みニューラルネットワーク)ベースの推論を高速にエッジ処理できる。しかしその後、巨大なパラメーター数を持つTransformerベースの生成AI技術が登場/普及し、推論への応用も加速している。
Transformerモデルの登場で新たな課題となったのが“4GBの壁”だ。32ビットCPUの場合、メモリ容量は最大4GBに制限されてしまう。一方、Transformerモデルは、簡単なものでも数GBのメモリを消費する。「ここのギャップをどう埋めるか。根本的な解決法としては、CPUのアーキテクチャを32ビットから64ビットにするしかない」(中島氏)。そこで64ビットCPU、かつIoT用途に適するコンパクトなCortex-A320が開発された。
中島氏は、標準的なArmv9アーキテクチャを採用しているため、ほかのArmv9 CPUで動くLinuxやAndroidのバイナリ資産がそのまま使える互換性を持つだけでなく、これまで数多く採用されてきたArmv8アーキテクチャのCPU(Cortex-A53、A35など)、マイコン(Cortex-M35など)からのアップグレードパスとしても「大きな利点がある」と紹介した。
「Cortex-A320プラットフォームがIoTエコシステムに与える影響は、非常に広範囲なものになる可能性を秘めている。現在、生成AIはハイパフォーマンスなサーバー上で運用されていることが多いが、今後のダウンサイジングによって、エッジデバイスへの展開が進むことが大きく期待されている。たとえばスマートウォッチ、スマートウェアラブルデバイスをCortex-A320ベースのプラットフォームに切り替えることで、よりリアルタイムなヘルスモニタリングだったり、携行可能なローカルLLMデバイスのようなものも実現可能になるのではないか」(中島氏)
