インテルがCTS-2を受注
ベースとなるのはSapphire Rapids
HPC分野では苦戦が続くインテル。米エネルギー省の科学技術計算施設NERSCにあるPerlmutterに加え、Auroraのためのアプリケーション開発に利用されるアルゴンヌ国立研究所のPolarisまでAMD/NVIDIA連合に持っていかれたのは、アプリケーション開発として「本当にいいのか?」という気がしてくる。
実際ALCF(Argonne Leadership Computing Facility)のPolarisのページを見ると下の表が出ているが、いくら似ているとは言え、例えばIntel MPIやMath Libraryなどのわりと肝心なモノが互換性がないのはどうか、という気がしてならない。こうした話はインテルにとっては屈辱モノではあるのだが、CTS-2の受注で一矢報いた格好になる。
CTS(Commodity Technology Systems)の話はまず連載286回で、もう少し詳しい話を連載347回でしているが、要するに技術的に冒険の少ない、確実に稼働する(ただしコストもその分安い)汎用のシステムである。
これの前身は連載347回で紹介したTLCC(Tri-lab Linux Capacity Cluster)で、アルゴンヌ/ロスアラモス/サンディアの3つの国立研究所で共同導入するLinuxクラスターである。
連載347回はTLCC-1とTLCC-2まで触れたが、これに引き続き導入予定だったTLCC-3が、CTS-1に名前を変え、2015年10月にPenguin Computingと契約を締結している。導入は2016年4月からスタートし、2018年9月までに完了しているが、これはそもそもクラスターであって、1つのシステムではない。実際2016年11月のTOP500では以下の7つのシステムがCTS-1として登録されている。
2016年11月のTOP500に登録されているCTS-1 | ||||||
---|---|---|---|---|---|---|
順位 | 設置場所 | システム | ||||
42位 | LLNL/NNSA | CTS-1 Jade | ||||
43位 | LLNL | CTS-1 Quartz | ||||
67位 | LANL | CTS-1 Grizzly | ||||
85位 | SNL/NNSA | CTS-1 Serrano | ||||
86位 | SNL/NNSA | CTS-1 Cayenne | ||||
90位 | LANL/NNSA | CTS-1 Fire | ||||
91位 | LANL/NNSA | CTS-1 Ice | ||||
169位 | SNL | CTS-1 Dark Ghost |
要するに同じ基本構成で、あとはノード数や細かな部分だけをカスタマイズして3つの研究所に導入、適時ネットワークを利用して大規模クラスターを組んだり分散利用したりできるものだ。これは便利に利用されていたが、さすがにXeon E5 v4(Haswell-EP)では性能面での力不足も多く、稼働時間も長くなってきたということでぼちぼち廃止が近くなってきた。
この代替システムとしてNNSAがCTS-2のRFP(プロポーザル要求)を出し、これに複数企業が応募していたわけだが、最終的にDell Technologyがこれを受注することになった。
このCTS-2は2022年中旬から導入が始まり、2025年中に完了予定(これに合わせてCTS-1は順次退役)であるが、このDellのマシンはインテルのSapphire Rapidsをベースとしたものになることが発表された。Ponte Vecchioを絡めない分、確実に納入できるであろうというあたりは、なんとかHPCへの足掛かりを残した格好だ。
ちなみにAMDではなくインテルベースのシステムで受注できた理由であるが、1つには現在のCTS-1上で動くアプリケーションには少なからずIntel MKL(Math Kernel Library:算術演算ライブラリー)を使ったものがあり、これらはインテルロック(AMDのプロセッサーでは動かない)がかかっているあたりも挙げられるかもしれない。ALCFのPolarisページにある表でMath LibraryにIntel MKLの名前が挙がっていないあたり、このあたり根深いものがあることがおわかりいただけよう。
この連載の記事
-
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート -
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ