このページの本文へ

前へ 1 2 3 4 5 次へ

ロードマップでわかる！当世プロセッサー事情第560回

Centaurの新製品はAIコプロセッサー内蔵のx86互換CPU　VIAのCPUロードマップ

2020年04月27日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

16個のスライスに分割した
巨大な32768bit幅のSIMD

　各々のスライス構造を示したのが下の画像である。

物理的には16個のスライスに分かれているものの、処理そのものは16個のスライスが同期して動く形になるので、本当に巨大な32768bit幅のSIMDなわけだ

Ncoreのワークフロー

(0) Bus Subsystem経由でD-RAM(Data RAM)とW-RAM(Weight RAM:ネットワークの重みを格納する領域)にデータが格納される(これは処理パイプラインの外)

(1) NDU(Neural Data Unit)が4096Bytes分のデータとWeightを読み込み、これの並べ替えや回転、Edge Swap、あるいは前サイクルで処理の終わった出力画像の取り込みといった処理を1サイクルで実行する。

(2) NPU(Neural Processing Unit)で処理する。処理はMAC(乗加算)と加減算、最大/最小、論理命令その他をサポート。9bit/16bit整数とBFloat16が取り扱える。9bit整数ならMACが1サイクル、BFloat16でも3サイクルで処理できる。ちなみにデータ型そのものは8/16bit整数とBFloat16で、8bit整数は内部で9bit化して処理される。ここでWeightのデータを基に、データをネットワーク構造にあわせて処理する。

(3) OUT-unitでは、NPUの結果の量子化やReLU(ランプ関数)/Tanh/シグモイド関数を利用した活性化、出力の正規化などが行なわれ、結果がD-RAMないしNDUに引き渡される。ほとんどの処理は1～3サイクルで完了するが、例えば8:1の重ね合わせなどは最悪値で10サイクルほど要する

　ここで1回分のデータ(例えば映像処理なら1フレーム分の画像データ)が完了するまで(1)～(3)をパイプライン式に繰り返し、終わったら(0)に戻る、という形である。

　一方制御命令であるが、128bit幅のもので、これを見ると限りなくVLIWに似ている。ただし詳細は未公開である。

制御命令は128bit幅だが詳細は不明。きっと以前と同様、秘密保持契約を結ぶと開示されるのであろう

　このあたりは昔のVIA C3などで提供されてきた独自拡張命令に近い感じに見える。ただ必要なツールやスタックはCentaurから提供されるので、直接アプリケーションプログラマーがこれを触る必要はない、としている。

　さてNcore、構造そのものはシンプルながら、なにしろ32Kbit幅のデータパスであるから、それなりに実装は困難だったらしい。

これを2.5GHzで動かすのも確かに大変。そこらのAIアクセラレーターよりはるかに難易度の高い構成になってるのは気のせいだろうか？

　下の画像がNcoreのうちでロジック部のアップである。この部分だけで11mm²というのは、性能を考えるとかなり小さい方である。

ロジック部のアップ。実際には、NCORE COMPUTEの倍近い面積を必要とするNCORE RAMも必要になるので、実質的なエリアサイズは30平方mm超と思われる

※お詫びと訂正：制御命令の名称に誤りがりました。記事を訂正してお詫びします。（2020年5月1日）

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

ASCII倶楽部とは

お知らせ

本日の即買いグッズ/アスキーストア'sセレクション

軽やかに座れる「3Dエアクッション」でどこでも高級ソファの魅力を！

ピックアップ

sponsored
始めやすいは嘘じゃない　SKYSEAクラウド版を情シスがレビュー

これなら使える　SKYSEAクラウド版は悩める情シスの救世主だった
sponsored

【お悩み解決】推し活もはかどる！ネット動画の時代だからこそ始めよう、全自動録画の魅力
sponsored
農作業効率化ソリューション「レポサク」を支える「MEEQ SIM」を紹介

【DX成功のヒント満載！】位置情報ソリューション開発のエゾウィン、IoT通信「MEEQ」ウェビナーに登壇
sponsored
「きったん」と「あーけん」がkrewData活用をディープに語る

krewData曼荼羅を見せてもらったら、業務改善や自動化のヒントが凝縮されていた
sponsored
ファーウェイ製品ならバッテリー長持ち＆周りの音も聞こえて安心です

春こそ始めたいジョギング＆ウォーキング！そのときスマートウォッチとイヤホンは欠かせない
sponsored
脅威の検知だけでなく対処までを自動化　「FortiEDR」で運用負荷の課題をクリア

EDRが発したアラートへの対応が遅れ、100GB超の情報漏洩！どうやったら防げた？
sponsored

自分なら80型のテレビよりこっち！　手軽に4K高画質と100インチ越えを狙うなら「N1S 4K」だ
sponsored
JN-IPS27Q4FL-HSPC9-DLをレビュー

超多機能27型WQHDディスプレー、USB Type-C給電・デイジーチェーン・有線LAN・KVMアリで3万円台に「おっ？」
sponsored
プランも機能差もたくさんあって迷ってしまうあなたのために

お得なのはどれ？ Backlog有料プランの分かりやすい選び方ガイド
sponsored
Dropboxも自社で活用　営業から人事、総務まで幅広く使える最新ツール

送った資料はしっかり読んでもらえたか？気になるそこを追跡できる「Dropbox DocSend」
sponsored
パソコンショップSEVENの「ZEFT Z55EU」について、中の人に聞いてきた

価格を抑えたいけど、ゲームがしっかり動くか不安という人はこれ！ゲーム性能高くコスパも重視したゲーミングPC
sponsored

価格7万円以下で買える！どこにでも置ける小型PC「GEEKOM A6」はパワフルで使い勝手◎
sponsored
MSI「Modern 14 F1M」レビュー

日本のビジネスワークをしっかり把握したCore 7ノートパソコン、1.5kgで入出力端子も充実、プレゼン用に180度開閉でコスパ抜群
sponsored
JN-DMD-IPS156Fをレビュー

2画面モバイルディスプレー2台で夢の5画面環境！ノートPCでも生産性爆上がり間違いなし
sponsored
「なんとなく」でも割とどうにかなるのでご安心を！

ちょっと世界の王になってくるわ…『シドマイヤーズシヴィライゼーションVII』は奥深いけど初心者でもイケるストラテジーゲームの新定番だ！
sponsored
iiyama キャンパスPCの「STYLE-14FH124-i5-UC1X-CP25」をチェック

これが私の学生時代にあれば……と思える11万円台・4年保証・1kg以下の14型ノートPC、24時間365日サポートもうれしい
sponsored
JN-IPS238G180FHDをレビュー

モンハンワイルズのオトモに最適!? 180Hz＆2万円切りのGEO限定ゲーミングモニターでひと狩りいこうぜ！
sponsored
MSI「MPG B850 EDGE TI WIFI」レビュー

白いマザーボードでは異質なほどゲーミング寄りデザインのAMD B850搭載モデルは貴重な存在
sponsored
AI学習向け／AI推論向けデータセンターとネットワーク、コンサルティングまでサービス提供

生成AI特化のデータセンターもまとめて提供　オプテージの“AIデータセンター戦略”
sponsored

たった６万円で不満なし！ディスプレイとキーボード、マウスまで一括で揃う“高コスパ”オールインワンPC「Lenovo A100」で勉強や仕事の効率アップ
sponsored
大阪市内で2026年1月に運用開始する“コネクティビティデータセンター”、注目を浴びる背景やターゲットを聞く

クラウド時代に選ばれるデータセンターへ　オプテージ「曽根崎データセンター」はネットワークへの接続性が強み
sponsored
31.5インチQD-OLEDパネルの4Kモデルに新色！MSI「MPG 321URXW QD-OLED」レビュー

ホワイトゲーミングPCに高機能なホワイトディスプレーを組み合わせたら神環境になった話
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

アスキーストア's 人気ランキングベスト5

Tweets by asciijpeditors