このページの本文へ

GPU Technology Conference Japan 2018レポート

NVIDIA、Turing世代のAI学習向けGPU「Tesla T4」発表

2018年09月13日 17時38分更新

文● ドリル北村/ASCII編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

 NVIDIAが都内でGTC(GPU Technology Conference) Japan 2018を開催し、NVIDIA創設者兼CEOのジェンスン・フアン氏が基調講演を行なった。

GTC(GPU Technology Conference) Japan 2018

8月に発表したQuadro RTXとGeForce 20シリーズをお披露目

 8月にSIGGRAPH 2018で発表した「Quadro RTX」と、Gamesconで発表した「GeForce 20」シリーズを披露した。Turingアーキテクチャーを採用した最初のGPUで、レイトレーシングの処理をハードウェアで実装している。レイトレーシングは、光源からの光がどこにどう反射して最終的に目に入るかを追跡していく手法で、とくに金属表面の映り込みなどでその効果を発揮する。

Quadro RTXシリーズを披露。Quadro RTX 8000に加えて5000/6000も用意される

リアルタイムレイトレーシングに対応した初のGeForce製品となるGeForce 20シリーズもお披露目

TuringアーキテクチャーのTesla T4を発表

 Turingアーキテクチャーを採用した製品はこれだけではなかった。基調講演ではディープラーニング推論向けアクセラレーター「Tesla T4」も発表された。

AIの深層学習に最適化された「Tesla T4」を発表。すでに量産体制に入っているという

 1クロックで4×4行列の積和演算を行なうTensorコアを320個搭載することで、NVIDIA GPUで訓練された任意のモデルを、高スループットかつ低レイテンシで実行するという。TDPは75Wで、Pascal世代のTesla P4よりも12倍性能が向上しているとのこと。

FP16(半精度浮動小数点数)の掛け算はFP32(単精度浮動小数点数)に積算され、INT8(8ビット整数)の掛け算およびINT4の掛け算はINT32に積算される。これによって最適な精度と性能が得られる

 同時に、デープラーニング用プラットフォーム「TensorRT 5.0」を発表した。TensorRTはCPU専用プラットフォームよりも最大40倍高速な推論を実現する。これにより機械翻訳や会話、言語処理アプリケーションにおいて劇的な性能向上が見込めるという。

Tesla T4をサポートするTensorRT 5.0は、CPU専用プラットフォームよりも最大40倍高速な推論を実現するという

200個のCPUを使用したサーバーの処理能力を、Tesla T4ならばわずか16個で実現可能。消費電力は60kWから2kWに、ラックの占有スペースは5分の1になる

【関連サイト】

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン