X280はAIをフルに活用するアプリケーションではなく
処理の一部に少しAI推論が入る用途に最適
このRVVにSiFiveの独自拡張命令を組み合わせるとどの程度高速化されるのか? という話だが、行列演算で12倍、MobileNet V1の推論で4倍といった数字が示されている。
本格的なAI推論をX280だけでやるのは厳しいとは思うが、そもそもX280のベースになるU74はLinuxが動く(=Linux動作に必要なMMUを始めとした機構が搭載されている)汎用のコアで、しかも最大8コアまでのマルチプロセッサーに対応した、アプリケーションプロセッサーに適した構成である。
AIをフルに活用するアプリケーション向けではないが、処理の一部に少しAI推論が入るといった用途であれば、専用のアクセラレーターを搭載しなくてもX280だけで事が足りそうだし、そうした用途を狙ったいわば「緩いAI向けアクセラレーター」とでもいうべきものがこのX280ということになる。
今のところRISC-Vは、PC向けというよりは組み込み機器向けといった方がメインで、X280もまさしくそういう用途を狙った製品である。SiFive以外にもAIを意識したRISC-V CPU IPは多く出ているが、少なくとも筆者がこれまで見た中では一番洗練された実装になっているように見える。
ちなみにSiFiveは現時点ではSiFive Intelligenceとして追加されたカスタム命令がどんなものかに関しては一切公開していない。あくまでも既存のフレームワークを経由すると、自動的にカスタム命令が使われる形の実装になっているようだ。
同じRISC-Vのメンバー企業であっても、カスタム命令に関しては真似されたくなかった、というあたりなのかもしれない。
この連載の記事
-
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ