Auroraは順調に遅延中
ところでこのプレスリリースの中には“Early Customer Adoption”という説があり、この中でAuroraが2万個のXeon MAXと6万個のGPU MAXを導入する予定だとした上で、しれっと「アルゴンヌ国立研究所は初期の利用者が2023年第3四半期にはシステム(=Aurora)にアクセスできるようになると予定している」と記している。
昨年11月のプレスリリースによれば、2022年中に128ノードから構成されるSunSpotと呼ばれる小規模システムを早期アクセス用にリリース、2023年1月からアルゴンヌ国立研究所を含む顧客にXeon MAX/GPU MAXを搭載したブレードの出荷を開始するとしていたが、実際にこれを採用したAuroraがいつ立ち上がるのかは明示されていなかった。
今回のリリースで、その立ち上げ時期が2023年7月以降になることがはっきりしたわけだ。ということは次のISC23(ハンブルグで今年5月21日より開催)には、まだフル構成のAuroraのデータはTOP500に入らない公算が高い。フル構成の数字がTOP500に入るのは、11月12日からデンバーで開催されるSC23になるのだろう。
ただ2023年11月と言うのは、ローレンス・リバモア国立研究所に導入されるEl Capitanもフル稼働している時期である。El Capitanの話は連載701回で説明したとおりで、当初の2023年初頭の導入からはやや後送りになっているが、おそらく今年11月のTOP500までには稼働を開始しているだろう。
ということで、2023年11月のTop500は、ハイエンドの座をAuroraとEl Capitanが競うことになるわけだが、筆者の予想としてはAuroraはかなり苦しそうに思える。理由は単純でノードの数である。インテルが明言しているようにAuroraは1万を超えるノードから構成される。一方でEl Capitanは連載701回でも説明したように3000ノードを下回ると予測される。
ピーク性能が同じだとすれば、ノード数が少ないほど実効性能が上がるわけで、この点でAuroraはかなり不利になる。消費電力での比較もさることながら、実効性能でAuroraがEl Capitanを上回るのはかなり厳しそうだ。
ところでそのAuroraの構成だが、先日もう少しだけ詳細を聞けたのでご紹介したい。まずラックであるが、Auroraブレードを格納した6本のラックごとに、熱交換器を収めたラックが2本入る。要するにAuroraブレードのラック3本毎に熱交換器のラックが一つ入る格好だ。
さて、下の画像はAuroraブレードのラックのアップだが、実は連載695回で書いた説明は間違い(CGが嘘)であって、実はラックは20×4段構成でAuroraのブレードを格納する。
うち16本がAuroraのブレードで、1ラックあたり64枚のAuroraのブレードが入る格好だ。では残りはなにか? という話だが、これは実は電源ユニットとのこと。こちらはAuroraのブレードの半分の高さで、16枚のAuroraブレードに対して8個の電源ユニットが搭載される。Auroraブレード2枚あたり1個という計算だ。電源ユニットも当然液冷だそうで、それもあってよく見ると電源ユニットにも冷却用のホースが来ているのがわかる。
なぜこれがわかったか? というと、今年2月のプレスリリースで、インテルはオレゴンのラボの中にBorealisと呼ばれるAuroraのテスト用システム(128ノードで、これはアルゴンヌ国立研究所のSunspotと同じ構成である)を稼働させていることを明らかにしたが、実は昨年このBorealisの見学ツアーに行けたからである。といっても写真撮影は厳禁だったため、情報としてお届けできることは少ないのだが。
ちなみにこのプレスリリースの中の動画を見ていると、レポーターのRob Kelton氏がイヤーマフを付けている(動画で2分13秒あたりから)のがわかるが、実際Borealisは壮絶にうるさかった。
この連載の記事
-
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ - この連載の一覧へ