1Wあたりの推論性能は他社の4倍以上
さて、話は一転して市場であるが、同社は1~100TOPS以上、というおそろしく広い範囲の市場を一気に狙うことを考えている。もっとも他社製品と異なるのは、それを低い消費電力でカバーするつもりなことだ。消費電力は最終的に動作周波数と、各ユニットに含まれる演算器の数で決まる。
Linley Spring Processor Forum 2021の開催に合わせて4月19日にexpederaはリリースを出し、Origin E2/E6/E8という3種類のIPを発表した。それぞれの構成は以下の通り。
expedera社重役の経歴 | ||||||
---|---|---|---|---|---|---|
Origin E2 | 省電力エッジデバイス向け。2.25K/4.5K/9K INT8 MACsを搭載。畳み込みニューラルネットワークがメイン。INT8/16のみ | |||||
Origin E6 | スマートフォンを含む広範な用途向け。4.5K/9K/18K INT8 MACsを搭載。同時に2つのネットワークを並行して稼働可能。畳み込みニューラルネットワーク(CNN)と再帰型ニューラルネットワーク(RNN)、それに長短期記憶(LSTM)に対応。INT8/16に加えFP16/BF16をオプションでサポートする | |||||
Origin E8 | L2/L3自動運転を含む高性能向け。36K/54K INT8 MACsを搭載。同時に8つまでのネットワークをQoS付きで並行して稼働可能。CNN/RNN/LSTMに対応。INT8/16に加えFP16/BF16をオプションでサポート |
ここで言うMACsというのはMatrix Enginesに含まれるMACユニットの数で、Origin E2なら1サイクルあたり最大9000個のMAC演算が可能というわけだ。
さて、性能として示されたスライドが下の画像だ。前回の画像を受けてのもので、「実シリコンで」2010 IPS/Wを実現した、としている。
ソースとして示されたリンクは[1]:https://developer.nvidia.com/embedded/jetson-agx-xavier-dl-inference-benchmarks、[2]:https://www.qualcomm.com/media/documents/files/2019-snapdragon-865-5g-ai-deep-dive-ziad-asghar-jeff-gehlhaar.pdf、[3]:https://www.anandtech.com/show/16083/qualcomms-cloud-ai-100-now-in-production-up-to-400tops-at-75wとなっている。[4]:はexpederaのホワイトペーパーへのリンクだ
実はこのチャート、ホワイトペーパーではもう少し詳細が載っている。
expederaによれば、同社のテストチップでは2010 IPS/Wであるが、例えばNvidiaのXavierでは実測値で95IPS/W、QualcommのSnapdragon 865では79IPS/Wだったとする。ただこれはDLA以外にSoC全体の消費電力が加味されているのでフェアではない、ということでそれぞれのチップのDLAの部分の消費電力を推定した上で計算したのが上の画像にある結果だとしている。
Xavierは全体では30Wほどだが、DLAは1.4Wほどの消費電力で、550IPS/Wとなる。QualcommはCloud AI 100の数字から450IPS/W、ArmのEthosの場合、メモリー構成によって性能が200~300IPS/Wの間で変化するとしている。一応expedera的には公平を期した結果というわけだ。なおTOPS/Wでは、18TOPS/Wになるというのがexpederaの主張である。
ちなみにホワイトペーパーでは、面積あたりの性能も出ている。expederaのテストチップは、TOPSでは1.8 TOPS/mm2で、これはMediaTekのSoCのものより50%高いとしているほか、ResNet-50の結果で言えばテストチップはおおむね189IPS/mm2。対してApple A13は69 IPS/mm2に過ぎないとしている。
創業2年かそこらで、しかも直近までステルスモードで進んでいたにも関わらず、すでにexpederaはTSMCの7nmプロセスで製造したテストチップが存在しており、4月19日にはIPの提供開始と、評価/ベンチマーク用にこのテストチップの供給も可能であることが発表されている。なんというか、とてもスタートアップ企業とは思えないほどの用意周到さが、expederaの最大の特徴かもしれない。
この連載の記事
-
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ