アクセラレーターを内蔵したSiMa.aiのAI推論向けSoC
MLSoC
前回、Groqの生い立ちを説明した折に少しだけ触れたのが、GroqのCOOだったKrishna Rangasayee氏が同社を辞して立ち上げたSiMa.aiという会社だ。
このSiMa.aiのMLSoC(Machine Learning SoC)プラットフォームも、Groqと同じく2020年春のLinley Proceoosr Conferenceで製品を発表していたので、こちらを説明しよう。
さてまずSiMa.aiのターゲットであるが、同社によればAI Inference(推論)市場は、Mobile Edge/Embedded/Cloudの3つに分断されているとする。
![](/img/2020/10/04/3102557/l/5d56cabab875d1fc.jpg)
AI Inference(推論)市場のターゲット。もっともこれが完全に分離しているかというと怪しい。実際次に紹介するCloud AI 100は、CloudとEmbedded Edgeの両方をターゲットにしているとしか思えない
ここでMobile Edge/IoTとは、要するにスマートフォンや組み込みのエンドデバイス(スマートスピーカーなど)だが、そうなるとモバイル向けSoCなどにAI Inference向けのアクセラレーターが組み込まれる形で提供されるので、そこに入り込むのは容易ではない。
またCloudの場合は、それこそNVIDIAが圧倒的シェアを誇り、そこにインテルやAMDやIBMが殴り込みをかけている猛烈な市場であり、ここにアクセラレーターを出しても採用される可能性は低い。
一方でEmbedded Edge、つまりこの両者の中間は、そうした圧倒的なソリューションが存在しないため、参入しても生き残れる可能性がある、としている。
ちなみにGroqはまさにCloudを志向した製品であり、Rangasayee氏が離脱したのはこのあたりの根本的な方向性の違いが理由なのかもしれない。
そんなわけで、SiMa.aiはEmbedded Edgeに向けた製品を開発しており、その第1世代がMLSoCということになる。もっともMLSoCのほとんどは、あまり独創的な部分は見当たらない。
![](/img/2020/10/04/3102558/l/2176f66774107bd5.jpg)
単純にアクセラレーターを出しても使ってもらいにくいので、アクセラレーターを内蔵したSoCの形で提供して使ってもらおうという意図は理解できる。ついでに自動車業界で採用されればさらにラッキー、というあたりがISO 26262対応の理由であろう
Application ProcessorはARM(具体的になにかは不明だが、Cortex-A35かCortex-A55あたりではないかと想像する)でLPDDRxコントローラーと10Gイーサネット/PCIe Gen4 x8あたりまではごく普通である。
セキュリティーはTrustZone IPをそのままだろう。Video Processor(ISP)やComputer Vision Processorになにを求めるかは不明だが、一応これらもIPとして入手は可能だ。
やや独創的なのは車載向けを考えているためか、Safety Processor(プロセッサーが異常動作をしていないかを確認するための機構)を搭載し、ISO 26262 ASIL-B/D準拠を謳っている。
余談になるがこのISO 26262とは自動車向けの「機能安全」と呼ばれる安全性を担保するための規格であり、ASIL-Bは目標故障率が10-7/時間、ASIL-Dでは10-8/時間とされる。
言い換えるとASIL-Bは1000万時間あたり1回、ASIL-Dは1億時間あたり1回が目標である。これを実現するには、壊れにくい回路を作るくらいでは足りず、例えばプロセッサーを2つ同時に動かし、片方に障害が生じたらそれを切り離してもう片方で処理を継続するといった仕組みが必要になる。
連載432回でフォールトトレラントという仕組みを取り入れたTandemのR2000ベースのプロセッサーの話をしたが、ここで利用されたロックステップという仕組みそのものである。
自動車だけでなく産業機械(例えばエレベーターや列車など、暴走したら大変なことになるもの)や航空機、医療機器などさまざまな用途向けに、この機能安全と呼ばれる規格が定められている。
ちなみに自動車向けと産業機器向け、航空機向けなどは全部別々の規格であり、その内部も共通する部分は多いが、それぞれの用途向けに異なる部分もあるので、自動車向けをそのまま産業機器向けにポンと持っていけるわけではない。
![](/img/blank.gif)
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ