インテルがCTS-2を受注
ベースとなるのはSapphire Rapids
HPC分野では苦戦が続くインテル。米エネルギー省の科学技術計算施設NERSCにあるPerlmutterに加え、Auroraのためのアプリケーション開発に利用されるアルゴンヌ国立研究所のPolarisまでAMD/NVIDIA連合に持っていかれたのは、アプリケーション開発として「本当にいいのか?」という気がしてくる。
実際ALCF(Argonne Leadership Computing Facility)のPolarisのページを見ると下の表が出ているが、いくら似ているとは言え、例えばIntel MPIやMath Libraryなどのわりと肝心なモノが互換性がないのはどうか、という気がしてならない。こうした話はインテルにとっては屈辱モノではあるのだが、CTS-2の受注で一矢報いた格好になる。
CTS(Commodity Technology Systems)の話はまず連載286回で、もう少し詳しい話を連載347回でしているが、要するに技術的に冒険の少ない、確実に稼働する(ただしコストもその分安い)汎用のシステムである。
これの前身は連載347回で紹介したTLCC(Tri-lab Linux Capacity Cluster)で、アルゴンヌ/ロスアラモス/サンディアの3つの国立研究所で共同導入するLinuxクラスターである。
連載347回はTLCC-1とTLCC-2まで触れたが、これに引き続き導入予定だったTLCC-3が、CTS-1に名前を変え、2015年10月にPenguin Computingと契約を締結している。導入は2016年4月からスタートし、2018年9月までに完了しているが、これはそもそもクラスターであって、1つのシステムではない。実際2016年11月のTOP500では以下の7つのシステムがCTS-1として登録されている。
2016年11月のTOP500に登録されているCTS-1 | ||||||
---|---|---|---|---|---|---|
順位 | 設置場所 | システム | ||||
42位 | LLNL/NNSA | CTS-1 Jade | ||||
43位 | LLNL | CTS-1 Quartz | ||||
67位 | LANL | CTS-1 Grizzly | ||||
85位 | SNL/NNSA | CTS-1 Serrano | ||||
86位 | SNL/NNSA | CTS-1 Cayenne | ||||
90位 | LANL/NNSA | CTS-1 Fire | ||||
91位 | LANL/NNSA | CTS-1 Ice | ||||
169位 | SNL | CTS-1 Dark Ghost |
要するに同じ基本構成で、あとはノード数や細かな部分だけをカスタマイズして3つの研究所に導入、適時ネットワークを利用して大規模クラスターを組んだり分散利用したりできるものだ。これは便利に利用されていたが、さすがにXeon E5 v4(Haswell-EP)では性能面での力不足も多く、稼働時間も長くなってきたということでぼちぼち廃止が近くなってきた。
この代替システムとしてNNSAがCTS-2のRFP(プロポーザル要求)を出し、これに複数企業が応募していたわけだが、最終的にDell Technologyがこれを受注することになった。
このCTS-2は2022年中旬から導入が始まり、2025年中に完了予定(これに合わせてCTS-1は順次退役)であるが、このDellのマシンはインテルのSapphire Rapidsをベースとしたものになることが発表された。Ponte Vecchioを絡めない分、確実に納入できるであろうというあたりは、なんとかHPCへの足掛かりを残した格好だ。
ちなみにAMDではなくインテルベースのシステムで受注できた理由であるが、1つには現在のCTS-1上で動くアプリケーションには少なからずIntel MKL(Math Kernel Library:算術演算ライブラリー)を使ったものがあり、これらはインテルロック(AMDのプロセッサーでは動かない)がかかっているあたりも挙げられるかもしれない。ALCFのPolarisページにある表でMath LibraryにIntel MKLの名前が挙がっていないあたり、このあたり根深いものがあることがおわかりいただけよう。
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ