このページの本文へ

前へ 1 2 3 4 次へ

ロードマップでわかる！当世プロセッサー事情第565回

性能/消費電力比が優秀なGoogle TPU　AIプロセッサーの昨今

2020年06月01日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

初代Google TPUの2倍の性能を誇る第2世代

　以下、この2つのソースをもとに解説する。まずGoogle TPU v2の基本構成が下の画像だ。1つのチップに2つのダイが搭載され、おのおののダイに8GBのHBMが装着される構成になっている。

初代Google TPUの反省は外部メモリーの帯域が低すぎたことだそうで、それもあってHBMを使って大幅に高速化された

　それぞれのコアの詳細は下の画像だ。MAC Unitは128×128と1/4のサイズになったが、その代わり一度に全ユニットの計算が可能になっている。

ダイあたりで言えば、PCIe Gen3 x32でホストと接続される構造となる。VPUはMXUの10分の1程度の性能とされる

　また16MBのVmemも搭載されている。加えて言えば、データ型も初代のINT 8からTPU v2ではBfloat16/FP32に切り替わった。推論だけならINT 8のままでいいのだろうが、学習に向けてはやはりもう少し精度というか桁数が欲しい、というニーズに応えたものである。

　ダイのフロアプランは下の画像がわかりやすい。MXUよりもVPU+Vmemの方がはるかに大きなエリアを占めているのがわかる。

PCIe Linkそのものはダイに1ヵ所か所で、このあたりだけ対称性が崩れている。製造プロセスやダイサイズなどは未公表だが、プロセスは時期的なものから考えるとTSMCの20nmではないかとみられている。動作速度は700MHz

　またこのGoogle TPU v2の設計の最中に、Bach normalizationという論文が発表されている。この仕組みを、Google TPU v2ではハードウェアとソフトウェアでサポートすることで、学習速度を最大14倍にできたとしている。

具体的にはベクトルユニットのスループットを初期デザインの8倍にしたほか、逆平方根の計算を行なうハードウェアを追加したとしている

　ちなみにCloud TPU v2が64台のPodで11.5TFlopsとされているので、1台(つまり4チップ)あたり180TFlops、ダイ1個あたり45TFlopsという計算になる。

こちらはHot Chipsの論文より

　Google TPU v2では先にも書いたがBfloat16/FP32で計算しているので、処理速度はチップ1つあたり45TOP/秒という計算になり、これはおおむね初代Google TPUの2倍の性能に相当する。

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

ASCII倶楽部とは

お知らせ

本日の即買いグッズ/アスキーストア'sセレクション

カメラ用フィルターをスマホで使って気軽にフィルターワーク

ピックアップ

sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
購入しやすい価格ながら機能充実、バッテリー長持ちの人気製品

1万円以下ウェアラブルの大定番がさらに進化！睡眠モニタリング精度アップの「HUAWEI Band 9」レビュー
sponsored

ゲームのフレームレート爆上げが狙える！ CrucialのDDR5-6000メモリー「Pro Overclocking」を使わぬ手はなし！
sponsored
eスポーツ大会で採用される24インチクラスの新モデル

180Hzで3万円切りの即買いモデル、スピーカー内蔵のゲーミングディスプレー「G255PF E2」レビュー
sponsored
新たな敵は地中から現れる！

さらなる刺客（シカク）が四角い地球を襲う！5月23日発売『デジボク地球防衛軍２（略）』の魅力をチェック
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか
sponsored
大阪・泉州産のスウェット生地を採用した「AKRacing by BEAMS DESIGN モデル」

スウェット生地のチェアってどう？編集部員何人かに座った感想を聞いてみた
sponsored
セブンアールジャパンの西川氏とASRockの原口氏にコダワリを聞いてきた

パソコンショップSEVENとASRockのコダワリが炸裂！ Threadripper PRO 7995WX搭載BTOPC
sponsored
従来よりもさらにコスパよくゲーミングPCを組みたい方へ

ゲーミングマザーボード「GAMING PLUS」シリーズ完全解説＆自作のオススメ構成例も紹介
sponsored

BaaS普及を追求し続けるGMOあおぞらネット銀行と、ARIのAWS導入支援cnarisに迫る
sponsored
強化ガラス製マウスパッド「ROG Moonstone」など気になるデバイスもまとめて試す！

静音性重視の独自スイッチ“ROG NX Snow”がイイ！「ROG Strix Scope II 96 Wireless」をレビュー
sponsored
LEVEL∞のゲーミングデスクトップ「LEVEL-M7A6-R77-TEX」を検証

20万円以下でこの性能は高コスパだぞ！手頃でゲームを快適に遊ぶBTOPCがほしいならコレ
sponsored

イラスト感覚で光が“描ける”　パナソニックのマイクロLEDを活用した次世代照明がすごい
sponsored
Core i7-14700KF搭載「LEVEL-R779-LC147KF-TTX」をチェック

性能・コスパで考える、超快適ゲーミングに最適なRTX 4070 SUPERのBTOゲーミングPCがコチラ！
sponsored
JN-PCY238FHDR180-Hシリーズをレビュー

色鮮やかな180Hz駆動ディスプレーが約2万円台！ゲーム環境にパステルカラーはいかが？
sponsored
JN-MD-IPS16WQXGARをレビュー

2560×1600ドットの16型モバイルディスプレー、家使いの二刀流もいけて3万円強は最高

アスキーストア's 人気ランキングベスト5

Tweets by asciijpeditors