インテルがCTS-2を受注
ベースとなるのはSapphire Rapids
HPC分野では苦戦が続くインテル。米エネルギー省の科学技術計算施設NERSCにあるPerlmutterに加え、Auroraのためのアプリケーション開発に利用されるアルゴンヌ国立研究所のPolarisまでAMD/NVIDIA連合に持っていかれたのは、アプリケーション開発として「本当にいいのか?」という気がしてくる。
実際ALCF(Argonne Leadership Computing Facility)のPolarisのページを見ると下の表が出ているが、いくら似ているとは言え、例えばIntel MPIやMath Libraryなどのわりと肝心なモノが互換性がないのはどうか、という気がしてならない。こうした話はインテルにとっては屈辱モノではあるのだが、CTS-2の受注で一矢報いた格好になる。
CTS(Commodity Technology Systems)の話はまず連載286回で、もう少し詳しい話を連載347回でしているが、要するに技術的に冒険の少ない、確実に稼働する(ただしコストもその分安い)汎用のシステムである。
これの前身は連載347回で紹介したTLCC(Tri-lab Linux Capacity Cluster)で、アルゴンヌ/ロスアラモス/サンディアの3つの国立研究所で共同導入するLinuxクラスターである。
連載347回はTLCC-1とTLCC-2まで触れたが、これに引き続き導入予定だったTLCC-3が、CTS-1に名前を変え、2015年10月にPenguin Computingと契約を締結している。導入は2016年4月からスタートし、2018年9月までに完了しているが、これはそもそもクラスターであって、1つのシステムではない。実際2016年11月のTOP500では以下の7つのシステムがCTS-1として登録されている。
2016年11月のTOP500に登録されているCTS-1 | ||||||
---|---|---|---|---|---|---|
順位 | 設置場所 | システム | ||||
42位 | LLNL/NNSA | CTS-1 Jade | ||||
43位 | LLNL | CTS-1 Quartz | ||||
67位 | LANL | CTS-1 Grizzly | ||||
85位 | SNL/NNSA | CTS-1 Serrano | ||||
86位 | SNL/NNSA | CTS-1 Cayenne | ||||
90位 | LANL/NNSA | CTS-1 Fire | ||||
91位 | LANL/NNSA | CTS-1 Ice | ||||
169位 | SNL | CTS-1 Dark Ghost |
要するに同じ基本構成で、あとはノード数や細かな部分だけをカスタマイズして3つの研究所に導入、適時ネットワークを利用して大規模クラスターを組んだり分散利用したりできるものだ。これは便利に利用されていたが、さすがにXeon E5 v4(Haswell-EP)では性能面での力不足も多く、稼働時間も長くなってきたということでぼちぼち廃止が近くなってきた。
この代替システムとしてNNSAがCTS-2のRFP(プロポーザル要求)を出し、これに複数企業が応募していたわけだが、最終的にDell Technologyがこれを受注することになった。
このCTS-2は2022年中旬から導入が始まり、2025年中に完了予定(これに合わせてCTS-1は順次退役)であるが、このDellのマシンはインテルのSapphire Rapidsをベースとしたものになることが発表された。Ponte Vecchioを絡めない分、確実に納入できるであろうというあたりは、なんとかHPCへの足掛かりを残した格好だ。
ちなみにAMDではなくインテルベースのシステムで受注できた理由であるが、1つには現在のCTS-1上で動くアプリケーションには少なからずIntel MKL(Math Kernel Library:算術演算ライブラリー)を使ったものがあり、これらはインテルロック(AMDのプロセッサーでは動かない)がかかっているあたりも挙げられるかもしれない。ALCFのPolarisページにある表でMath LibraryにIntel MKLの名前が挙がっていないあたり、このあたり根深いものがあることがおわかりいただけよう。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ