ロードマップでわかる!当世プロセッサー事情 第633回
Ponte VecchioとIntel Arcに関する疑問をRaja Koduri氏が回答 インテル GPUロードマップ
2021年09月20日 12時00分更新
Xe-Linkは8タイルの相互接続でしか使えず
スケールアウトにも利用できない
Xe-LinkはすべてのタイルがPeer-to-Peerで接続される構造になっている。これを例えばツリー構成にしたり2D/3Dメッシュにしたりする方策を取れば、より多くのタイルを接続できるし、あるいはスケールアウトの方向(つまりラック内の別のタイルグループに接続するなど)にも応用できそうではあるのだが、これに関しては「現状のXe-Linkの能力は限られている」としており、あくまで8タイルの相互接続の形でしか使えないこと、それとスケールアウトには利用できないとした。
実際アルゴンヌ国立研究所に納入予定のAuroraの場合、1枚のモジュール内の接続はXe-Linkで行なわれるが、モジュール間はHPE(旧Cray)のSlingShotで接続されることになっており、スケールアウトの接続はSlingShotのような外部インターコネクトに任せる、という返事であった。
余談であるが、前回の下の画像で、筆者は赤枠で囲んだ部分をXe-Link/PCIe&CXL Bridgeと説明した。ただ、ひょっとするともう1つこのチップには用途があるのかもしれない。
PMICには大きすぎる気がするし、他のモジュールへのReTimerという可能性もあるが、Xe-Linkのままではホストと接続する方法がないので、どこかにブリッジが必要なのは事実で、このチップがブリッジではないかと筆者は考えている
実はAuroraの構成において、インテル/HPE/アルゴンヌ国立研究所のいずれもSlingShotが「どこに」接続されるのか、明示的に説明をしていない。普通に考えればCPU側のPCIeバスに接続するという形になるのだが、実はそうではない構成がある。
HPE/AMDが納入するFrontierがそれで、SlingShotがRadeon Instinct側に接続されることになっている。Frontierの場合は1つのノードがEPYC×2+Radeon Instinct×4で構成されているが、ノードあたり4つのSlingShotのEndpointが搭載されることになっている。
以上の話を念頭に、アルゴンヌ国立研究所のAuroraのインターコネクトページを見てみると、“Aurora will use Slingshot fabric connected in a Dragonfly topology with 8 fabric endpoints per node.”という文言が踊っている。つまりモジュールに8つ、SlingShotのエンドポイントが搭載されるわけで、これはどう考えてもSapphire RapidsというよりもPonte Vecchioに搭載されているとしか思えない。つまり赤枠の中のチップは、Xe-Link/SlingShot Bridgeと考えた方が良さそうな気がする。
この場合PCIe/CXLがどこから出てくるのか? という疑問は当然あるわけで、ひょっとするとBase Tile側にPCIeのI/Fが入るというのが普通の考え方だが、大穴としては赤枠の中のチップがDragonFly Endpoint兼PCIe/CXL Bridgeという可能性も残されている。このあたりは来年Auroraが導入される時期にはもう少し詳細が明らかにされることを期待したい。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ













