Cascade Lakeの106倍の性能という
QualcommのCloud AI 100
SiMa.aiとは逆に、突如としてAIアクセラレーターチップそのものを発表したのがQualcommである。
SiMa.aiやGroqのようなスタートアップ企業の場合、まずファンドなどから資金を集める必要があり、そのためにはアーキテクチャーや市場、将来性などを早いタイミングでアピールする必要があるため、チップ完成の前に発表するわけだが、Qualcommのような大企業の場合は自前で開発資金を十分賄えるので別にチップの完成まで発表の必要はないわけだ。
さてそのQualcommが9月16日に発表したのがCloud AI 100である。開発の動機は単純で、より高性能のAIプロセッサーが必要だからである。
Qualcommの場合、Snapdragonシリーズに搭載されているHexagon DSPを利用してAIの処理が可能で、15TOPS程度までの処理性能はすでに確保している。
QualcommはMobile Edgeの10社のうちの1社であり、このあたりは抜け目がない。ただ、いわゆるEmbedded Edgeではもっと高い処理性能が必要であり、Cloud向けはさらに高性能なものが要求される。ここに向けたアクセラレーターがCloud AI 100となる。
もっともQualcommは、その詳細を発表するつもりはまるでないようで、内部構造として示されたのは下の画像だけである。
Cloud AI 100の概要。HBMやGDDR/DDRではなく、LPDDRを利用するというあたりがQualcommならではだろう。もっとも昨今LPDDR4は4.3Gbpsに達しており、GDDR/HBMほどではないがDDR4よりは帯域が広いので、これはこれで合理的かもしれない。オンダイSRAMも最大144MBと強烈。コアあたり9MBということだろう
核となるのはAIC(AI Core)であるが、これが最大で16コアで400TOPSとあるので、1コアあたり25TOPSほどの計算になる。
ラインナップは15W、25W、75Wの3つで、15Wのものは4コア、25Wのものは6コアで、どちらも動作周波数を若干落とした構成。フルスピードのものが16コア構成で75W動作ということなのだろう。
さてこのCloud AI 100、性能として示されたのが下の画像だ。20WというのはDual M.2カードの構成に近いだろうが、Cascade Lakeを1とした時に106倍の性能とされる。
もっと強烈なのが下の画像で、GroqのTSPすら比較にならないほど高速、というのがQualcommの主張である。
さてQualcommのおもしろいのはここからだ。PCIeカードもしくはDual M.2カードというからには、サーバーなどに装着する形での運用を考えそうなものだが、なぜかその開発キットはEmbedded Edge向けの構成なことである。
Cloud AI 100はあくまでもアクセラレーターなので、Snapdragon 865およびSnapdragon X55と組み合わせることで、アプリケーションプロセッサー兼ISPと5Gの接続性を確保できるとする。
Qualcommによる、この開発キットの紹介ビデオ(https://www.youtube.com/watch?v=AFb1KoGUOlE)によれば、24台のフルHDカメラを接続し、この動画を25fpsでキャプチャーしながらそこにAI処理を施せるとしている。
24台のフルHDカメラで25fpsの動画をキャプチャーしながらAI処理を施せるという。しかもそれぞれのカメラに対して異なるネットワークを適用可能だとしている。もちろんこれはシンプルな車両認識アルゴリズムなので、もっと複雑なアルゴリズムを実行させるともう少し効率は落ちるかもしれない
これは従来のEmbedded Edge向けAIアクセラレーターでは手が出ない要求性能であり、これを見事に処理できるというわけだ。
この開発キットは今年10月から出荷予定で、Cloud AI 100チップそのものの量産開始は2021年前半とされる。Qualcommのことだからきっと量産を開始しても内部の詳細は公開しない気がするが、このAI推論市場もなかなか厳しい戦いになっていることがおわかりいただけたはずだ。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ

















