アクセラレーターを内蔵したSiMa.aiのAI推論向けSoC
MLSoC
前回、Groqの生い立ちを説明した折に少しだけ触れたのが、GroqのCOOだったKrishna Rangasayee氏が同社を辞して立ち上げたSiMa.aiという会社だ。
このSiMa.aiのMLSoC(Machine Learning SoC)プラットフォームも、Groqと同じく2020年春のLinley Proceoosr Conferenceで製品を発表していたので、こちらを説明しよう。
さてまずSiMa.aiのターゲットであるが、同社によればAI Inference(推論)市場は、Mobile Edge/Embedded/Cloudの3つに分断されているとする。
AI Inference(推論)市場のターゲット。もっともこれが完全に分離しているかというと怪しい。実際次に紹介するCloud AI 100は、CloudとEmbedded Edgeの両方をターゲットにしているとしか思えない
ここでMobile Edge/IoTとは、要するにスマートフォンや組み込みのエンドデバイス(スマートスピーカーなど)だが、そうなるとモバイル向けSoCなどにAI Inference向けのアクセラレーターが組み込まれる形で提供されるので、そこに入り込むのは容易ではない。
またCloudの場合は、それこそNVIDIAが圧倒的シェアを誇り、そこにインテルやAMDやIBMが殴り込みをかけている猛烈な市場であり、ここにアクセラレーターを出しても採用される可能性は低い。
一方でEmbedded Edge、つまりこの両者の中間は、そうした圧倒的なソリューションが存在しないため、参入しても生き残れる可能性がある、としている。
ちなみにGroqはまさにCloudを志向した製品であり、Rangasayee氏が離脱したのはこのあたりの根本的な方向性の違いが理由なのかもしれない。
そんなわけで、SiMa.aiはEmbedded Edgeに向けた製品を開発しており、その第1世代がMLSoCということになる。もっともMLSoCのほとんどは、あまり独創的な部分は見当たらない。
単純にアクセラレーターを出しても使ってもらいにくいので、アクセラレーターを内蔵したSoCの形で提供して使ってもらおうという意図は理解できる。ついでに自動車業界で採用されればさらにラッキー、というあたりがISO 26262対応の理由であろう
Application ProcessorはARM(具体的になにかは不明だが、Cortex-A35かCortex-A55あたりではないかと想像する)でLPDDRxコントローラーと10Gイーサネット/PCIe Gen4 x8あたりまではごく普通である。
セキュリティーはTrustZone IPをそのままだろう。Video Processor(ISP)やComputer Vision Processorになにを求めるかは不明だが、一応これらもIPとして入手は可能だ。
やや独創的なのは車載向けを考えているためか、Safety Processor(プロセッサーが異常動作をしていないかを確認するための機構)を搭載し、ISO 26262 ASIL-B/D準拠を謳っている。
余談になるがこのISO 26262とは自動車向けの「機能安全」と呼ばれる安全性を担保するための規格であり、ASIL-Bは目標故障率が10-7/時間、ASIL-Dでは10-8/時間とされる。
言い換えるとASIL-Bは1000万時間あたり1回、ASIL-Dは1億時間あたり1回が目標である。これを実現するには、壊れにくい回路を作るくらいでは足りず、例えばプロセッサーを2つ同時に動かし、片方に障害が生じたらそれを切り離してもう片方で処理を継続するといった仕組みが必要になる。
連載432回でフォールトトレラントという仕組みを取り入れたTandemのR2000ベースのプロセッサーの話をしたが、ここで利用されたロックステップという仕組みそのものである。
自動車だけでなく産業機械(例えばエレベーターや列車など、暴走したら大変なことになるもの)や航空機、医療機器などさまざまな用途向けに、この機能安全と呼ばれる規格が定められている。
ちなみに自動車向けと産業機器向け、航空機向けなどは全部別々の規格であり、その内部も共通する部分は多いが、それぞれの用途向けに異なる部分もあるので、自動車向けをそのまま産業機器向けにポンと持っていけるわけではない。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











