Cascade Lakeの106倍の性能という
QualcommのCloud AI 100
SiMa.aiとは逆に、突如としてAIアクセラレーターチップそのものを発表したのがQualcommである。
SiMa.aiやGroqのようなスタートアップ企業の場合、まずファンドなどから資金を集める必要があり、そのためにはアーキテクチャーや市場、将来性などを早いタイミングでアピールする必要があるため、チップ完成の前に発表するわけだが、Qualcommのような大企業の場合は自前で開発資金を十分賄えるので別にチップの完成まで発表の必要はないわけだ。
さてそのQualcommが9月16日に発表したのがCloud AI 100である。開発の動機は単純で、より高性能のAIプロセッサーが必要だからである。
Qualcommの場合、Snapdragonシリーズに搭載されているHexagon DSPを利用してAIの処理が可能で、15TOPS程度までの処理性能はすでに確保している。
QualcommはMobile Edgeの10社のうちの1社であり、このあたりは抜け目がない。ただ、いわゆるEmbedded Edgeではもっと高い処理性能が必要であり、Cloud向けはさらに高性能なものが要求される。ここに向けたアクセラレーターがCloud AI 100となる。
もっともQualcommは、その詳細を発表するつもりはまるでないようで、内部構造として示されたのは下の画像だけである。

Cloud AI 100の概要。HBMやGDDR/DDRではなく、LPDDRを利用するというあたりがQualcommならではだろう。もっとも昨今LPDDR4は4.3Gbpsに達しており、GDDR/HBMほどではないがDDR4よりは帯域が広いので、これはこれで合理的かもしれない。オンダイSRAMも最大144MBと強烈。コアあたり9MBということだろう
核となるのはAIC(AI Core)であるが、これが最大で16コアで400TOPSとあるので、1コアあたり25TOPSほどの計算になる。
ラインナップは15W、25W、75Wの3つで、15Wのものは4コア、25Wのものは6コアで、どちらも動作周波数を若干落とした構成。フルスピードのものが16コア構成で75W動作ということなのだろう。
さてこのCloud AI 100、性能として示されたのが下の画像だ。20WというのはDual M.2カードの構成に近いだろうが、Cascade Lakeを1とした時に106倍の性能とされる。
もっと強烈なのが下の画像で、GroqのTSPすら比較にならないほど高速、というのがQualcommの主張である。
さてQualcommのおもしろいのはここからだ。PCIeカードもしくはDual M.2カードというからには、サーバーなどに装着する形での運用を考えそうなものだが、なぜかその開発キットはEmbedded Edge向けの構成なことである。
Cloud AI 100はあくまでもアクセラレーターなので、Snapdragon 865およびSnapdragon X55と組み合わせることで、アプリケーションプロセッサー兼ISPと5Gの接続性を確保できるとする。
Qualcommによる、この開発キットの紹介ビデオ(https://www.youtube.com/watch?v=AFb1KoGUOlE)によれば、24台のフルHDカメラを接続し、この動画を25fpsでキャプチャーしながらそこにAI処理を施せるとしている。

24台のフルHDカメラで25fpsの動画をキャプチャーしながらAI処理を施せるという。しかもそれぞれのカメラに対して異なるネットワークを適用可能だとしている。もちろんこれはシンプルな車両認識アルゴリズムなので、もっと複雑なアルゴリズムを実行させるともう少し効率は落ちるかもしれない
これは従来のEmbedded Edge向けAIアクセラレーターでは手が出ない要求性能であり、これを見事に処理できるというわけだ。
この開発キットは今年10月から出荷予定で、Cloud AI 100チップそのものの量産開始は2021年前半とされる。Qualcommのことだからきっと量産を開始しても内部の詳細は公開しない気がするが、このAI推論市場もなかなか厳しい戦いになっていることがおわかりいただけたはずだ。

この連載の記事
-
第813回
PC
Granite Rapid-DことXeon 6 SoCを12製品発表、HCCとXCCの2種類が存在する インテル CPUロードマップ -
第812回
PC
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC IEDM 2024レポート -
第811回
PC
Panther Lakeを2025年後半、Nova Lakeを2026年に投入 インテル CPUロードマップ -
第810回
PC
2nmプロセスのN2がTSMCで今年量産開始 IEDM 2024レポート -
第809回
PC
銅配線をルテニウム配線に変えると抵抗を25%削減できる IEDM 2024レポート -
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート - この連載の一覧へ