競合の30倍の性能を謳う
機械学習用アクセラレーターMosaic
話を元に戻すと、MLSoCの大半は通常のIPで賄えているが、唯一SiMa.aiが自分で設計したと思われるのがMosaicという名前のMLA(Machine Learning Accelerator)である。
MLSoCにはこのMosaicが1つ搭載され、5Wの消費電力で50TOPSの性能である。計算として正しいかどうかは微妙だが、先のGroqの場合、1PetaOps/秒の処理性能で、ResNet-50を利用して毎秒1万8900枚の画像を処理できる(*1)とされる。
1PetaOps/秒=1000TOPSなので、50TOPSというのはその20分の1で、毎秒945枚の画像をResNet-50で処理できる計算になる。もっとも実際にはこんな処理性能は無理(後で数字が出てくる)ではあるが、それなりの速度での画像認識が可能となっている。
ただSiMa.aiはこのMosaicの詳細は明らかにしていない。内部の説明は下の画像1枚だけだ。
Mosaic単体でISO 26262 ASIL-Bに対応できるというのはけっこうすごい話で、これを2つ並べてロックステップ動作させれば理論上はASIL-Dも行けるはずだが、通常のプロセッサーはともかくこうしたアレイプロセッサーでロックステップが簡単にできるのかは不明である。
独自バスを使うことで複数枚のMosaicを連携して駆動できるようだが、そうしたアクセラレーターを出す予定があるのかどうかも現状では不明である。
ソフトウェアとしては、既存のフレームワークやランタイムと互換性を持たせたエリアと、Mosaicを駆動するエリアの2層構造からなる、というのはこの手のアクセラレーターとしてはごく普通である。
さて性能であるが、シミュレーションを利用したいくつかのテスト結果がこちら。
ResnetV1_101では、画像のスループットが35枚/秒、Mobilenet_v1では257.75枚/秒とされるが、画像サイズがフルHD(1920×1080ピクセル)だとするとこれは超高速である。
しかも平均効率が40%以下、というのは「効率を上げればもっと性能があがる」と考えられるが、その一方で「効率を上げるのが難しいアーキテクチャーである」という見方もできるわけで、このあたりはもう少し詳細な情報がほしいところだ。
他にもいくつかのベンチマークを行なった結果も示されており、さまざまな用途で高い性能/消費電力比を実現できるとしている。
AI向けアクセラレーターの場合、10TOPS/Wというのは1つのマジックナンバーで、これを実現できると言いつつ、実際に作るとここまで性能が出ないということは珍しくない。その意味では、シミュレーターではなく実際のチップでこれが実現できたら素晴らしい成果と言えるのだが。
ちなみにSiMa.aiはMLSoCの用途の一例として、半自動運転車や荷物運搬ロボット、セキュリティーカメラなどを想定しており、チップが出荷されれば評判になりそうだ。
問題はその出荷時期がまったく見えないことだろうか? 今年のAI Hardware Summitに同社は参加しておらず、現時点ではアップデートがない。ただ10月20日からスタートする秋のLinley Processor Conferenceでは同社のKavitha Prasad氏(VP of Systems Solutions)が講演を予定しているそうなので、ここに期待したいところだ。
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ