激戦のAI推論市場で生き残りを賭けるプロセッサー　AIプロセッサーの昨今

2020年10月05日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

Cascade Lakeの106倍の性能という
QualcommのCloud AI 100

　SiMa.aiとは逆に、突如としてAIアクセラレーターチップそのものを発表したのがQualcommである。

　SiMa.aiやGroqのようなスタートアップ企業の場合、まずファンドなどから資金を集める必要があり、そのためにはアーキテクチャーや市場、将来性などを早いタイミングでアピールする必要があるため、チップ完成の前に発表するわけだが、Qualcommのような大企業の場合は自前で開発資金を十分賄えるので別にチップの完成まで発表の必要はないわけだ。

　さてそのQualcommが9月16日に発表したのがCloud AI 100である。開発の動機は単純で、より高性能のAIプロセッサーが必要だからである。

　Qualcommの場合、Snapdragonシリーズに搭載されているHexagon DSPを利用してAIの処理が可能で、15TOPS程度までの処理性能はすでに確保している。

Snapdragonに搭載されるHexagon DSPは、最近ではTensorアクセラレーターなども搭載しており、十分に強力なAIアクセラレーターとして利用されている

　QualcommはMobile Edgeの10社のうちの1社であり、このあたりは抜け目がない。ただ、いわゆるEmbedded Edgeではもっと高い処理性能が必要であり、Cloud向けはさらに高性能なものが要求される。ここに向けたアクセラレーターがCloud AI 100となる。

Cloud AI 100は、Dual M.2(M.2コネクターが2つ並んだフォームファクター)ないしPCIe x8のカードという形(Dual M.2は消費電力に併せて2種類)が提供される

　もっともQualcommは、その詳細を発表するつもりはまるでないようで、内部構造として示されたのは下の画像だけである。

Cloud AI 100の概要。HBMやGDDR/DDRではなく、LPDDRを利用するというあたりがQualcommならではだろう。もっとも昨今LPDDR4は4.3Gbpsに達しており、GDDR/HBMほどではないがDDR4よりは帯域が広いので、これはこれで合理的かもしれない。オンダイSRAMも最大144MBと強烈。コアあたり9MBということだろう

　核となるのはAIC(AI Core)であるが、これが最大で16コアで400TOPSとあるので、1コアあたり25TOPSほどの計算になる。

　ラインナップは15W、25W、75Wの3つで、15Wのものは4コア、25Wのものは6コアで、どちらも動作周波数を若干落とした構成。フルスピードのものが16コア構成で75W動作ということなのだろう。

　さてこのCloud AI 100、性能として示されたのが下の画像だ。20WというのはDual M.2カードの構成に近いだろうが、Cascade Lakeを1とした時に106倍の性能とされる。