ロードマップでわかる!当世プロセッサー事情 第736回
第6世代XeonのGranite Rapidsでは大容量L3を搭載しMCR-DIMMにも対応 インテル CPUロードマップ
2023年09月11日 12時00分更新
前回に引き続き、Hot Chips 2023での発表について説明しよう。今回のHot ChipsでインテルはXeon関連で2つ発表をしている。1つは今回紹介する“Architecting for Flexibility and Value with future Intel Xeon processors”、もう1つは次回紹介する“Intel Energy Efficiency Architecture”である。ということでまずはその将来のXeonプロセッサーについてだ。
Sierra Forest/Granite Rapids以降の世代では
AMDと同様のチップレット構成になる
基本的なアイディアは、データセンターにおけるワークロードのニーズが次第に拡大し、クラウドサービスに代表されるサーバー台数の増強(スケールアウト)の方向と、HPCやAIなどの処理能力を高める(スケールアップ)の方向の2つに大きく分かれつつあることからスタートしている。
そこで、PコアとEコアをそれぞれの用途向けに利用するのが現在の方向である。現行のXeon Scalableは基本Pコアのみで構成されているが、来年にはEコアベースのSierra Forestが投入される(これにIntel 3プロセスが利用される)のはすでに発表済み。この2つの製品ラインが今後も継承されることが再確認できたのが下の画像となる。
現在出荷中の第4世代Xeon Scalable、つまりSapphire Rapidsと、年末までに発表される予定のEmerald Rapidsは、どちらもPコアベースなので上の画像の左にある“Optimized for Performance”に属する製品であるが、すでにマルチタイルによるモジュラー構成である。Sapphire Rapidsの説明はもう不要だろうし、Emerald Rapidsもサンプルの写真を見る限りはマルチタイル構成である。
逆に“Optimized for Efficiency”に分類されるSierra Forestの方はまだ構成が不明であるが、今さらモノリシックな巨大なダイを作るとは思えない。AMDのEPYCはいち早くチップレット構成を取っており、しかもコンピュートタイル(CCD)とI/Oタイル(IOD)を分離する形で実装していた。
これに比べるとインテルの方はコンピュートとI/Oを混在したタイル同士を接続する方法をSapphire Rapidsでは取っており、おそらくEmerald Rapidsもこれを踏襲しているものと思われる。次々世代、つまりSierra Forest/Granite Rapids以降の世代ではAMD同様の構成になることが今回明らかにされた。
昨今の先端プロセスでは、大容量の3次キャッシュやPHY、I/Oなどの機能を先端プロセスで作ると無駄が多いことはこれまで何度か説明してきた。先端プロセスで作った場合と古いプロセスで作った場合で、ほとんど面積が変わらない。だとすると、先端プロセスで作っても機能が変わらずにコストだけが上昇するからだ。
これを明確に示しているのがAMDのNavi 31/32であり、メモリーコントローラーとインフィニティ・キャッシュはTSMCのN6で、GPUコアそのものはTSMCのN5で製造されている。EPYCシリーズもMilan世代からはメモリーコントローラーやI/Oなどは全部TSMC N12で製造されるIODに集約される格好だ。今回のインテルの発表は、この構図に「一歩近づいた」形になる。
ただし、その実装方法はけっこう異なる。下の画像がその内部構造だが、メモリーコントローラーは各コンピュート・チップレットに分散配置される形になる。またコンピュート・チップレット内部のメッシュを延長するような形で相互接続されるというのはSapphire Rapidsの時と同じだ。
Sapphire Rapidsの場合、4つのタイルを鏡対称で接続する関係で、2種類のタイルを用意する必要があり、これが明らかにコストアップの要因になっていた。Emerald Rapidsでは巨大なタイル×2にしたのは、この方式では同一のタイルを180度回転させて接続するだけで済むため、タイルを一種類で済ませられる。
上の画像の次世代Xeonの場合はこの方式を踏襲し、メッシュの横方向は1つのチップレット内で完結させ、縦方向を相互接続する形に変更したようだ。このやり方では、チップレット数が増えると縦方向が長くなりすぎる可能性があるが、おそらくはチップレット内では縦方向の接続を最小限とし、横方向を長めに取る形でバランスを取っているのだろう。
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ