今回はInference(推論)向けプロセッサーの話だ。AI向けのニーズが高まり始めた当初、Armは意外に静観して見えた。当時はさまざまなAI向けプロセッサーが発表されていたものの、まだ実アプリケーションに組み込むという形での応用が今一つ明確になっておらず、どの程度アクセルを踏み込むべきか躊躇していたところもあるのかもしれない。
CPUとGPUでAI/ML(機械学習)のフレームワークを稼働させるためのArmNNこそ2018年に発表されたが、これは既存のプロセッサー/GPU IP上で主要なフレームワーク(当初はCaffe2のみだったが、今はだいぶ増えた)を容易に稼働させられるという以上のものではなく、当時のCPUやGPUのIPも決してAI/MLの動作に特化した機能(例えばFP16のサポートや畳み込み演算の高速化など)は搭載されていなかった。
ところがそうしているうちに、AI向けのニーズがどんどん出てきた。スマートフォンなら画像による本人認証や撮影した画像にAIを利用したフィルタリングをかける、あるいは動画の補正をAIで処理するということが一般的になってきたからだ。
これに向けてArmも水面下でAI/MLの機能をCPU/GPUに付加したり、AI/ML処理専用プロセッサーを開発したりしていた。2017年にはCortex-A75/A55でFP16とDot Products(内積の一種のドット積の演算)機能を追加。2018年2月にはProject Trilliumという名前でMLプロセッサーを開発していることを明らかにし、2018年8月のHotChips 30ではそのプロセッサーの詳細を公開した。
2019年の5月にまずEthos-N77を発表(ちなみにこの時にはArm ML Processorという名前であった)。次いで同年10月にはEthos-N37/N57を追加。そして2020年5月にはEthos-N78を追加している。このEthos-Nシリーズはスマートフォンやスマート家電、および高機能な組み込み機器をターゲットとしたもので、要求性能的には1TOPS~10TOPS程度が求められる分野となっていた。
Ethos-N87発表時のスライドより。監視カメラやエントリーレベルスマートフォンなどなら1~2TOPS、メインストリーム向けスマートフォンやスマートホーム(画像によるユーザー認証などが要求される)では2~4TOPS、AIを使った画像フィルタリングなどは最大10TOPSほどの処理性能が必要と見込んでいた
ちなみにこの4製品のラインナップであるが、基本的な構成は同じで、AI処理を行なうCE(Compute Engine)の数と搭載するSRAMの容量のみの差であり、以下のようになっている。
| Ethos-Nシリーズの差異 | ||||||
|---|---|---|---|---|---|---|
| CU数 | SRAM | 想定性能 | ||||
| Ethos-N37 | 最大4 | 512KB | 最大1TOPS | |||
| Ethos-N57 | 最大8 | 512KB | 最大2TOPS | |||
| Ethos-N77 | 最大16 | 1~4MB | 最大4TOPS | |||
| Ethos-N78 | 最大32 | 384K~4MB | 最大10TOPS | |||
動作周波数に関しては、ArmはIPを提供するだけなので、最終的な決定はArmではなくSoCベンダーが行なうことになるが、Ethos-N37~N77は一応1GHz程度の動作を想定した数字であり、一方Ethos-N78のみ、おそらく5nmプロセスあたりがターゲットとなっている関係で、動作周波数をもう少し引き上げて1.25GHz程度を想定していると考えられる。
さて、問題はこのEthos-Nシリーズが市場をつかめなかったことだ。主要なスマートフォン向けSoCベンダーは、Ethos-Nシリーズが発表される前から相次いで自社開発のAI/MLプロセッサーを搭載。各社のスマートフォンはこうした独自プロセッサーを利用して撮影した映像のフィルタリングや映像効果付与などに利用し始め、ArmのAI/ML向けプロセッサーIPがなくても困らない状況ができあがってしまった。
例えばAppleで言えば、2017年9月に発表されたiPhone 8シリーズに搭載されたApple A11にNeural Engineと呼ばれるAIプロセッサーが初搭載された。ということは、2017年の早い時期にA11の量産に入っていたわけで、これに間に合わせようと思ったら2016年では間に合わず、2015年中にIPを提供しないといけない。QualcommやHuawei、MediaTekなどのSoCベンダーでも話は同じであり、こうした主要なスマートフォン向けSoCベンダーの製品にEthosシリーズは採用されていない。
Armにこのあたりの話を聞くと「確かに今は少ないが、今後新たにSoCを構築するベンダーはまだAIプロセッサーを持っていないので、そうしたベンダーにとっては(CPUと併せて)ワンストップでIPを提供するというのは大きなメリットとなる」「現在は自分たちで設計しているかもしれないが、今後それをさらに発展させていくための費用はバカにならない。どこかで経済的に折り合いがつかなくなるだろう」と一応静観の構えである。
もちろん長期的には使われていく可能性はあるが、少なくとも短期的には市場をつかむことに失敗したわけだ。ここまで連載で紹介してきたベンチャー系と異なり、Armは別にEthosシリーズを売りそこなったからといって、それで会社が揺らいだりはしないので、落ち着いていられるということもある。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 -
第864回
PC
なぜAMDはチップレットで勝利したのか? 2万ドルのウェハーから逆算する経済的合理性 -
第863回
PC
銅配線はなぜ限界なのか? ルテニウムへの移行で変わる半導体製造の常識と課題 -
第862回
PC
「ビル100階建て相当」の超難工事! DRAM微細化が限界を超え前人未到の垂直化へ突入 -
第861回
PC
INT4量子化+高度な電圧管理で消費電力60%削減かつ90%性能アップ! Snapdragon X2 Eliteの最先端技術を解説 -
第860回
PC
NVIDIAのVeraとRubinはPCIe Gen6対応、176スレッドの新アーキテクチャー搭載! 最高クラスの性能でAI開発を革新 -
第859回
デジタル
組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現 -
第858回
デジタル
CES 2026で実機を披露! AMDが発表した最先端AIラックHeliosの最新仕様を独自解説 - この連載の一覧へ











