今回はInference(推論)向けプロセッサーの話だ。AI向けのニーズが高まり始めた当初、Armは意外に静観して見えた。当時はさまざまなAI向けプロセッサーが発表されていたものの、まだ実アプリケーションに組み込むという形での応用が今一つ明確になっておらず、どの程度アクセルを踏み込むべきか躊躇していたところもあるのかもしれない。
CPUとGPUでAI/ML(機械学習)のフレームワークを稼働させるためのArmNNこそ2018年に発表されたが、これは既存のプロセッサー/GPU IP上で主要なフレームワーク(当初はCaffe2のみだったが、今はだいぶ増えた)を容易に稼働させられるという以上のものではなく、当時のCPUやGPUのIPも決してAI/MLの動作に特化した機能(例えばFP16のサポートや畳み込み演算の高速化など)は搭載されていなかった。
ところがそうしているうちに、AI向けのニーズがどんどん出てきた。スマートフォンなら画像による本人認証や撮影した画像にAIを利用したフィルタリングをかける、あるいは動画の補正をAIで処理するということが一般的になってきたからだ。
これに向けてArmも水面下でAI/MLの機能をCPU/GPUに付加したり、AI/ML処理専用プロセッサーを開発したりしていた。2017年にはCortex-A75/A55でFP16とDot Products(内積の一種のドット積の演算)機能を追加。2018年2月にはProject Trilliumという名前でMLプロセッサーを開発していることを明らかにし、2018年8月のHotChips 30ではそのプロセッサーの詳細を公開した。
2019年の5月にまずEthos-N77を発表(ちなみにこの時にはArm ML Processorという名前であった)。次いで同年10月にはEthos-N37/N57を追加。そして2020年5月にはEthos-N78を追加している。このEthos-Nシリーズはスマートフォンやスマート家電、および高機能な組み込み機器をターゲットとしたもので、要求性能的には1TOPS~10TOPS程度が求められる分野となっていた。
ちなみにこの4製品のラインナップであるが、基本的な構成は同じで、AI処理を行なうCE(Compute Engine)の数と搭載するSRAMの容量のみの差であり、以下のようになっている。
Ethos-Nシリーズの差異 | ||||||
---|---|---|---|---|---|---|
CU数 | SRAM | 想定性能 | ||||
Ethos-N37 | 最大4 | 512KB | 最大1TOPS | |||
Ethos-N57 | 最大8 | 512KB | 最大2TOPS | |||
Ethos-N77 | 最大16 | 1~4MB | 最大4TOPS | |||
Ethos-N78 | 最大32 | 384K~4MB | 最大10TOPS |
動作周波数に関しては、ArmはIPを提供するだけなので、最終的な決定はArmではなくSoCベンダーが行なうことになるが、Ethos-N37~N77は一応1GHz程度の動作を想定した数字であり、一方Ethos-N78のみ、おそらく5nmプロセスあたりがターゲットとなっている関係で、動作周波数をもう少し引き上げて1.25GHz程度を想定していると考えられる。
さて、問題はこのEthos-Nシリーズが市場をつかめなかったことだ。主要なスマートフォン向けSoCベンダーは、Ethos-Nシリーズが発表される前から相次いで自社開発のAI/MLプロセッサーを搭載。各社のスマートフォンはこうした独自プロセッサーを利用して撮影した映像のフィルタリングや映像効果付与などに利用し始め、ArmのAI/ML向けプロセッサーIPがなくても困らない状況ができあがってしまった。
例えばAppleで言えば、2017年9月に発表されたiPhone 8シリーズに搭載されたApple A11にNeural Engineと呼ばれるAIプロセッサーが初搭載された。ということは、2017年の早い時期にA11の量産に入っていたわけで、これに間に合わせようと思ったら2016年では間に合わず、2015年中にIPを提供しないといけない。QualcommやHuawei、MediaTekなどのSoCベンダーでも話は同じであり、こうした主要なスマートフォン向けSoCベンダーの製品にEthosシリーズは採用されていない。
Armにこのあたりの話を聞くと「確かに今は少ないが、今後新たにSoCを構築するベンダーはまだAIプロセッサーを持っていないので、そうしたベンダーにとっては(CPUと併せて)ワンストップでIPを提供するというのは大きなメリットとなる」「現在は自分たちで設計しているかもしれないが、今後それをさらに発展させていくための費用はバカにならない。どこかで経済的に折り合いがつかなくなるだろう」と一応静観の構えである。
もちろん長期的には使われていく可能性はあるが、少なくとも短期的には市場をつかむことに失敗したわけだ。ここまで連載で紹介してきたベンチャー系と異なり、Armは別にEthosシリーズを売りそこなったからといって、それで会社が揺らいだりはしないので、落ち着いていられるということもある。
この連載の記事
-
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ