このページの本文へ

ロードマップでわかる!当世プロセッサー事情第485回

AMD GPUロードマップ  Radeon InstinctはTesla V100とほぼ同性能

2018年11月19日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

Radeon Instinctが年内に出荷開始

 さてそのTSMCのN7を利用する7nm VEGA(VEGA20)、以前連載442回では「出荷は2018年の終わりか、下手をすると2019年になると思われる」としたが、基調講演ではインテルに移籍したRaja Koduri氏の後を引き継いで、RTG(Radeon Technologies Groupエンジニアリング部門を率いるDavid Wang氏がRadeon Instinct MI60を示しながら、これが年内に出荷開始されることを発表した。

Radeon Instinct MI60を示すDavid Wang氏(SVP of Engineering, RTG)

 まずは今回の発表の内容をまとめると以下の通り。

  • 発表されたのはRadeon Instinct MI60とMI50の2製品。主要なスペックは表にまとめたとおりである。ちなみにどちらもTDPは300W。価格は現時点では未公表。
  • ダイ(Vega20)はTSMCのN7で製造され、132億トランジスタ。ダイサイズは331mm2となっている。
  • 内部構成そのものは既存のVega 10からの大幅な変更はない。
  • メモリーはHBM×4の構成に。したがってメモリーバス幅はVega 10から2倍になった計算。
  • Vega 20同士の接続は、従来のCrossFire/Native CrossFireに代わってInfinity Fabricによる相互接続がサポートされた。
  • SR-IOVを搭載し、複数VMからの同時アクセスや、一つのVMから最大8つまでのGPU利用をサポート。
  • AMDが従来からMI向けに提供してきたROCmが2.0になった。
Radeon Instinctの主要スペック
  MI60 MI50 MI25
CU数 64 60 64
SP数 4096 3840 4096
Max Core Speed(MHz) 1800 1746 1500?
性能 Int8(TOPS) 58.9 53.6 49?
FP16(TFlops) 29.5 26.8 24.6
FP32(TFlops) 14.7 13.4 12.29
FP64(TFlops) 7.4 6.7 0.768
メモリー Capacity(GB) 32 16 16
Bus 4096bit+ECC 2048bit+ECC
Clock 1GHz 968MHz
Bandwidth 1TB/秒 484GB/秒
Infinity Fabric Bandwidth 200GB/秒 N/A
ちなみに左のRadeon Instinct M125に使われているVega 10は64CU/4096SPながら、トランジスタ数は125億個、ダイサイズは486平方mm
内部構成。既存のVega 10からの大幅な変更はないが、NCUの中はいろいろ変更がなされている
ECCのサポートはもちろんエラー対策のため。実際のメモリー容量は36GB(MI60)ないし18GB(MI50)で、このうちメモリーとして利用できるのがそれぞれ32/16GBとなる計算だ
PCIeはGen 4ではx16で64GB/秒、一方Infinity Fabricは100GB/秒となる
SR-IOVのコントローラーがVega 20内に入ったことで、SR-IOVベースで複数のVMからの同時アクセスが可能になった、ということと思われる
ROCmの変更点は多岐に渡り、性能改善以外にもLinux Kernel 4.17のサポートとかdocker/kubernetesなどのコンテナのサポートなども挙げられている。もっとも現状はまだ1.9.1がダウンロード可能な状態で、2.0の提供はもう少し先になる

この連載の記事