Cascade Lakeの106倍の性能という
QualcommのCloud AI 100
SiMa.aiとは逆に、突如としてAIアクセラレーターチップそのものを発表したのがQualcommである。
SiMa.aiやGroqのようなスタートアップ企業の場合、まずファンドなどから資金を集める必要があり、そのためにはアーキテクチャーや市場、将来性などを早いタイミングでアピールする必要があるため、チップ完成の前に発表するわけだが、Qualcommのような大企業の場合は自前で開発資金を十分賄えるので別にチップの完成まで発表の必要はないわけだ。
さてそのQualcommが9月16日に発表したのがCloud AI 100である。開発の動機は単純で、より高性能のAIプロセッサーが必要だからである。
Qualcommの場合、Snapdragonシリーズに搭載されているHexagon DSPを利用してAIの処理が可能で、15TOPS程度までの処理性能はすでに確保している。
QualcommはMobile Edgeの10社のうちの1社であり、このあたりは抜け目がない。ただ、いわゆるEmbedded Edgeではもっと高い処理性能が必要であり、Cloud向けはさらに高性能なものが要求される。ここに向けたアクセラレーターがCloud AI 100となる。
もっともQualcommは、その詳細を発表するつもりはまるでないようで、内部構造として示されたのは下の画像だけである。
![](/img/2020/10/04/3102548/l/6850ae3c0e7cf533.jpg)
Cloud AI 100の概要。HBMやGDDR/DDRではなく、LPDDRを利用するというあたりがQualcommならではだろう。もっとも昨今LPDDR4は4.3Gbpsに達しており、GDDR/HBMほどではないがDDR4よりは帯域が広いので、これはこれで合理的かもしれない。オンダイSRAMも最大144MBと強烈。コアあたり9MBということだろう
核となるのはAIC(AI Core)であるが、これが最大で16コアで400TOPSとあるので、1コアあたり25TOPSほどの計算になる。
ラインナップは15W、25W、75Wの3つで、15Wのものは4コア、25Wのものは6コアで、どちらも動作周波数を若干落とした構成。フルスピードのものが16コア構成で75W動作ということなのだろう。
さてこのCloud AI 100、性能として示されたのが下の画像だ。20WというのはDual M.2カードの構成に近いだろうが、Cascade Lakeを1とした時に106倍の性能とされる。
もっと強烈なのが下の画像で、GroqのTSPすら比較にならないほど高速、というのがQualcommの主張である。
さてQualcommのおもしろいのはここからだ。PCIeカードもしくはDual M.2カードというからには、サーバーなどに装着する形での運用を考えそうなものだが、なぜかその開発キットはEmbedded Edge向けの構成なことである。
Cloud AI 100はあくまでもアクセラレーターなので、Snapdragon 865およびSnapdragon X55と組み合わせることで、アプリケーションプロセッサー兼ISPと5Gの接続性を確保できるとする。
Qualcommによる、この開発キットの紹介ビデオ(https://www.youtube.com/watch?v=AFb1KoGUOlE)によれば、24台のフルHDカメラを接続し、この動画を25fpsでキャプチャーしながらそこにAI処理を施せるとしている。
![](/img/2020/10/04/3102553/l/34eae19070bf4544.jpg)
24台のフルHDカメラで25fpsの動画をキャプチャーしながらAI処理を施せるという。しかもそれぞれのカメラに対して異なるネットワークを適用可能だとしている。もちろんこれはシンプルな車両認識アルゴリズムなので、もっと複雑なアルゴリズムを実行させるともう少し効率は落ちるかもしれない
これは従来のEmbedded Edge向けAIアクセラレーターでは手が出ない要求性能であり、これを見事に処理できるというわけだ。
この開発キットは今年10月から出荷予定で、Cloud AI 100チップそのものの量産開始は2021年前半とされる。Qualcommのことだからきっと量産を開始しても内部の詳細は公開しない気がするが、このAI推論市場もなかなか厳しい戦いになっていることがおわかりいただけたはずだ。
![](/img/blank.gif)
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ