AIプロセッサーの性能比較
これまでけっこうな数のAIプロセッサを紹介してきたが、ほとんどのケースで「当社の○○は△△社の××と比較してn倍の性能」とか「ピーク性能×××TOPS」みたいな表記である。基準がないというのが1つの理由であり、それもあってMLCommonsという業界標準団体がMLPerfという標準ベンチマークを策定中である。
今年4月21日にはMLPerf Inference 1.0がリリースされ、すでにそれなりの数のベンチマーク結果が登録されてはいるのだが、クラウドあるいはエッジ向けはともかく、MCU上で動くような小さなものにはあまり適さないという問題はまだ残っている。過去に紹介した例で言えば、FlexLogicなどがそうで、ここはダイサイズあたりのスループットという、これはこれで類を見ない基準で性能をアピールしている。
この問題について、今回初日に行なわれたEdge AI向けで2社がまったく同じ主張をしているのが少しおもしろかった。まずはexpedera。ピークのTOPS性能だけを見ても仕方がないし、そもそも内部の利用率や周辺回路を含めたシステム全体の消費電力、チップの価格なども関係してくるとした上で、IPS(推論性能:回数/秒)を消費電力で割った、IPS/Wを判断基準にすべきだ、と主張している。
ちなみにベンチマークはResNet-50を使うのが一般的としたうえで、おおむね550IPS/Wあたりに性能の壁がある、とexpederaは説明している。
ほぼ同じ主張をしたのは、expederaの次に説明したHailoだ。通常AIチップの市場は以下の3つを使うことが多い。
- X:TOPs(ピーク性能)
- Y:TOPS/W(ピーク性能をTDPで割った、性能効率)
- Z:ResNet-50のフレームレート
TOPs/Wは良く使われてはいるが、そもそもそのTOPsはピーク性能であることが多く、現実的ではないとした上で、それよりはフレームレート(つまり毎秒の推論数)を消費電力で割った、FPS/Wが良い指標になるとしている。
expederaとHailoがどちらもResNet-50の「消費電力1Wあたりの推論性能」で比較しよう、とまるで申し合わせたかのように主張するのはなかなか興味深い。ということは同じように考えているメーカーは他にもいるかもしれないわけで、今後登場する製品やすでに登場している製品のマーケティングに多少影響を与えるかもしれない。
ただIPベンダーの場合、最終的な性能は当然どのプロセスでどのくらいの動作周波数で動かすかによって変わってくる。かつてARMがやっていたように、「WWW社のXXXプロセスで、動作周波数YYYだとZZZ IPS/Wになる」というようなアピールの仕方になるのだろうか?
この連載の記事
-
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ