競合の30倍の性能を謳う
機械学習用アクセラレーターMosaic
話を元に戻すと、MLSoCの大半は通常のIPで賄えているが、唯一SiMa.aiが自分で設計したと思われるのがMosaicという名前のMLA(Machine Learning Accelerator)である。
MLSoCにはこのMosaicが1つ搭載され、5Wの消費電力で50TOPSの性能である。計算として正しいかどうかは微妙だが、先のGroqの場合、1PetaOps/秒の処理性能で、ResNet-50を利用して毎秒1万8900枚の画像を処理できる(*1)とされる。
1PetaOps/秒=1000TOPSなので、50TOPSというのはその20分の1で、毎秒945枚の画像をResNet-50で処理できる計算になる。もっとも実際にはこんな処理性能は無理(後で数字が出てくる)ではあるが、それなりの速度での画像認識が可能となっている。
ただSiMa.aiはこのMosaicの詳細は明らかにしていない。内部の説明は下の画像1枚だけだ。
Mosaicの概要。S/W managed routingというあたりが肝の1つな気もするが、現在これに関して10以上の特許出願中とあるので、特許が取れるまでは詳細は公開するつもりがなさそうだ。Edge向けということでINT 8のみのサポートというのは、用途を考えれば不思議ではない
Mosaic単体でISO 26262 ASIL-Bに対応できるというのはけっこうすごい話で、これを2つ並べてロックステップ動作させれば理論上はASIL-Dも行けるはずだが、通常のプロセッサーはともかくこうしたアレイプロセッサーでロックステップが簡単にできるのかは不明である。
独自バスを使うことで複数枚のMosaicを連携して駆動できるようだが、そうしたアクセラレーターを出す予定があるのかどうかも現状では不明である。
ソフトウェアとしては、既存のフレームワークやランタイムと互換性を持たせたエリアと、Mosaicを駆動するエリアの2層構造からなる、というのはこの手のアクセラレーターとしてはごく普通である。
さて性能であるが、シミュレーションを利用したいくつかのテスト結果がこちら。
ResnetV1_101では、画像のスループットが35枚/秒、Mobilenet_v1では257.75枚/秒とされるが、画像サイズがフルHD(1920×1080ピクセル)だとするとこれは超高速である。
しかも平均効率が40%以下、というのは「効率を上げればもっと性能があがる」と考えられるが、その一方で「効率を上げるのが難しいアーキテクチャーである」という見方もできるわけで、このあたりはもう少し詳細な情報がほしいところだ。
他にもいくつかのベンチマークを行なった結果も示されており、さまざまな用途で高い性能/消費電力比を実現できるとしている。
AI向けアクセラレーターの場合、10TOPS/Wというのは1つのマジックナンバーで、これを実現できると言いつつ、実際に作るとここまで性能が出ないということは珍しくない。その意味では、シミュレーターではなく実際のチップでこれが実現できたら素晴らしい成果と言えるのだが。
ちなみにSiMa.aiはMLSoCの用途の一例として、半自動運転車や荷物運搬ロボット、セキュリティーカメラなどを想定しており、チップが出荷されれば評判になりそうだ。
こうした業界の顧客が高性能・低消費電力のAIチップを求めているのは周知の事実である。例えば最後のセキュリティーカメラの場合、現状では2~4台程度のカメラの映像を、まとめて複数枚のGPUカードを差した組み込み向けサーバーで処理するという実装が行なわれている
問題はその出荷時期がまったく見えないことだろうか? 今年のAI Hardware Summitに同社は参加しておらず、現時点ではアップデートがない。ただ10月20日からスタートする秋のLinley Processor Conferenceでは同社のKavitha Prasad氏(VP of Systems Solutions)が講演を予定しているそうなので、ここに期待したいところだ。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ














