Sapphire RapidsのHBM版は
Xeon MAXというブランドになる
さてそのSapphire Rapidsの最初の納入先の1つは間違いなくアルゴンヌ国立研究所である。いうまでもなくAurora向けの納入である。11月9日にダラスでSC22が開催されたが、これに合わせてインテルはプレスリリースを出し、アルゴンヌ国立研究所や京大、その他のサイトに納入するHPC向けのSapphire RapidsをXeon MAXというブランドにすることを明らかにした。ちなみにPonte Vecchioの方はIntel MAX Series 1xxx GPUというブランドになるそうだ。
このXeon MAXであるが、該当するのはSapphire Rapids HBMのみになりそうだ。というのはリリースを読んでも「Sapphire RapidsをXeon MAXとして販売する」とはどこにも書いておらず、また同じ11月9日に出した別のリリースでは「第4世代Xeon ScalableとHabana Gaudi 2によるMLPerf Training v2.1の結果がMLCommonsに登録された」としている。
要するにSapphire Rapidsそのものは引き続き従来のXeon Scalableとして発売され、Sapphire Rapids HBMのみがXeon MAXというブランドになると考えるのが妥当そうである。
よくわからないのはSKUである。Ponte Vecchioの方はIntel MAX Series 1100/1350/1550という3つのグレードがあり、それぞれ56/96/128 Xeコアを搭載するとされるが、Xeon MAXの方はそのSKUに関する説明が一切ない。
一応このXeon MAXは最大56コア(この数字が公式に発表されるのはこれが最初)とされており、連載586回で触れたように、14コアのタイルが4つ集積されていることが確定した格好だ。
ちなみにXeon MAXのTDPは350W。第3世代Xeon Scalableに属するXeon Platinum 8380でも270Wであることを考えると、コア数が増えたことを勘案してもけっこう大き目という感じはある。
絶対的な消費電力という観点で言えば先日発表になったAMDのGenoaベースのEPYC 9654/9654Pは定格TDPが360Wだが、こちらは96コアであることを考えると、コアあたりの消費電力はXeon MAXが2倍以上ということになる。もちろんHBM2を64GB分積層していることを勘案する必要はあるだろうが。
スパコン「Aurora」がTOP500に載らず
構築するのに必要な数のXeon MAXが集まらない
さて問題はそのXeon MAXとMAX Series 1xxx GPU(おそらく1550だろう)を組み合わせて構築されるAuroraである。連載632回でもAuroraには触れたが、すでに稼働予定が1年スライドしている。そんなこともあって前回のTOP500にはAuroraはエントリーされなかった。では今回は? というと、今回もエントリーがなく、それもあってTOP500のトップは相変わらずFrontierのままである。
ただ今回SC22に合わせてインテルはイベントを打っており、先のMAXシリーズの発表以外にもAuroraのアップデートを公開したりしている。
その動画から抜粋したのが下の画像なのだが、どうも怪しい。
Auroraでは2つのXeon Maxと6つのMax Series GPUでノードを構成する。Auroraでは、これを1つのラックに64枚装着する格好と思われる。ちなみにAuroraはこのブレード1枚を1ノードとして計算する。インテルのリリースによれば、Auroraは1万以上のブレード(=1万以上のノード)から構成されるそうで、ということは最低でもラックは156本以上存在することになる。
まぁここまでは良い。問題は4つ前の画像が何か? ということだ。これはAuroraのブレードの表側にはどうやっても見えない。そもそもAuroraはブレードを縦置きだが、シャーシが横置きになっている時点で明らかに別物である。
実はこの答えも動画の後半に含まれている。Auroraのブレードは本当にAurora専用という感じであるが、もう少し汎用のデータセンター向けとしてインテルはMax Series GPU OAM×4とXeon Max×2を組み合わせた1Uブレードベースのシステムを提供している。動画内で示されたのは、この汎用サーバーの構成に思える。ということはAuroraかどうかも結構怪しい。
連載635回で紹介したNNSAのCTS-2やリリースにも名前が出ていた京都大学学術情報メディアセンター、あるいはロスアラモス国立研究所のCrossroadなど、あちこちにXeon MAXをベースとしたシステムが納入されることはすでに明らかにされており、そうしたいくつかのサイトのどれかの写真の可能性が高い。
ちなみにFrontierの導入に先立って、128ノードの小規模な先行開発向けであるSunspotというシステムがアルゴンヌ国立研究所に導入され、2022年末から稼働を開始するとしている。
このSunspotは時期的に言っても、製品版のXeon MAXではなくPRQのものを利用して構築され、後で製品版に置き換えるという形をとるように思われる。
それにしても、ここまで引っ張ってまだ稼働していない、というのは正直びっくりである。Auroraのフル構成は無理にしてもSunspotを利用してのLINPACK測定はそう難しくないだろうに、そのSunspotすらTOP500にエントリーされていないというのは、Sunspotを構築するのに必要な数のXeon MAXが十分に手当てできない、という裏返しでもある。
もともとXeon MAXはそれぞれのタイルのダイサイズが400mm2クラスという、かなり巨大なダイであり、決して量が取れる構成ではない。本格量産がスタートした時点でどの程度供給されるか、少し不安に感じる話ではある。
この連載の記事
-
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ