ロードマップでわかる!当世プロセッサー事情 第590回
Radeon Instinct MI100が採用するCDNAアーキテクチャーの内部構造 AMD GPUロードマップ
2020年11月23日 12時00分更新
メモリーはHBM2Eを採用
入手性に困難もなく妥当な選択
ダイの話はもう少し後にして、メモリーについて説明しよう。メモリーそのものはHBM2であるが、従来のHBM2ではなく、転送速度を2.4Gbpsに引き上げたHBM2Eが採用された。JEDECは2018年12月にJESD235を発表(最新はJESD235C)しており、最大でピンあたり2.4Gbpsとなったほか、最大で12スタックまでの積層が可能になっている。
HBM2Eについては今年2月にSamsungが量産開始を発表、7月にはSK HYnixも量産開始をアナウンス、Micronもすでに製品を提供中である。
したがって入手性には困難はなく、妥当な構成と言える。余談ながらNVIDIAも、HBM2Eの8スタックでスタックあたり16GB、トータルで80GBの容量となるNVIDIA A100 80GBを発表している。実際I/Fが2.4Gbpsに対応できれば、後はHBM2を入れ替えるだけで実装できるため、これは妥当な選択である。ひょっとすると今後AMDも64GBメモリー搭載のRadeon Instinct MI100を投入しても不思議ではない。
XGMI Linkを3つに増やして
I/F周りを276GB/秒に引きあげる
次にI/F周り。Radeon Instinctのインターコネクト(というよりインフィニティーファブリック)のロードマップは今年3月に公開されており、すでに現状のRadeon Instinct MI50/60で、ここで言う第2世代に対応しているのだが、CNDA 1.0でもまだこの第2世代の構成となる。つまり4枚のRadeon Instinct MI100をブリッジカードで接続できる格好だ。
ただし、Radeon Instinct MI50/60ではこのブリッジカード経由で184GB/秒での接続が可能だったが、Radeon Instinct MI100ではこれが276GB/秒に引きあがった。
これはなにか? というと、Radeon Instinct MI50/60では23GT/秒の16bit幅で92GB/秒の帯域を持つXGMI Linkを2つ持つ。これを利用して4枚のRadeon Instinctを下図の左側のように接続する形だ。
対してRadeon Instinct MI100ではLinkの速度そのものは同じながら、XGMI Linkが3つに増やされた。このため、図の右側のようにすべてのRadeon Instinct MI100ボード同士が1:1で直接接続されるようになっている。
ちなみにEPYC1つに4つまでRadeon Instinctを接続できるので、2 SocketのEPYCだと8枚までRadeon Instinctを装着できることになる。
この連載の記事
-
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ