Xeonブランドで登場した
Knights Corner
こうした準備期間を経て、2012年にインテルはKnights Cornerベースの製品をXeon Phiとして発売する。
実は2011年のISCの会場で、インテルは単にKnights Ferryの性能をアピールするだけではなく、Knights Cornerのチップのデモや、DGEMM(倍精度の行列演算)で1TFLOPSを超える性能があることをアピールしていた。ただこの時はまだ製品発表には至っていない。
製品が発表されたのは2012年6月のことで、この時にはISC 12にあわせてXeon Phiという新しい製品ブランドを発表した。
内部の詳細については、同じく2012年8月に開催されたHotChips 24で明らかにされている。といっても、この時点ではまだコア数は50以上というだけで厳密なコア数は示されなかった。
ただ同時に発表されたKnights Cornerのダイ写真から、最大62コアであることは推察がついた。
内部構造は相変わらずリングバスを使って相互接続する方式で、コアの内部構造は(プロセス微細化以外は)Knights Ferryと同じこと、Vector ALUは引き続き16-wideの構造になっていることが示されている。
おもしろいのが下の画像で、これは2012年6月のTOP500のリストから、3社のアクセラレーターを使った場合の性能/消費電力比のトップを並べたものである。
ここでインテルが社内に構築したDiscoveryというシステムは118.6TFLOPSを100.80KWで実現しており、バルセロナ・スーパーコンピューター・センターが構築したBULLX B505ベースのシステムの103.2TFLOPS/81.50KWや、長崎大学のDEGIMA クラスターの64.8TFLOPS/47.05KWと比べても、より高い性能/消費電力比が得られると主張していることだ。
単に性能/消費電力だけでなく、勢力的にも無視できない規模になった。2012年6月のTOP500リストの中には44システムがXeon Phiベースとしてランクインしている。
ただまだこの時点ではXeon Phiの生産がそれほど十分ではなかったのだろう。どのサイトも限られた数のXeon Phiしか搭載しておらず、最高性能を出したシステムは上に出てきたインテルのDiscoveryの150位となっているのは、仕方ないところであろう。
なお、この時点ではまだ公式な意味での出荷は開始されていない。したがってインテルを含む44のシステムは、いずれも正式出荷前の製品をベースにシステムを構築した形だ。正式出荷が始まったのは2012年末のことで、まずはXeon Phi 5110Pが出荷される。
この製品は60コア構成で、動作周波数は1.053GHz、メモリー8GBというもの。コアそのものは全部で62個あるが、うち2つは冗長化した(無効化した)形での出荷となっている。
今もってインテルはKnights Cornerのダイサイズを発表していないのだが、世の中には製品版のXeon Phiを買ってヒートスプレッダーを引っぺがした猛者の方がおられ(関連リンク)、この方の実測によれば720mm2に達するとしている。
これだけ大きければ欠陥が多少生じるのは止むを得ないところで、欠陥がある部位を無効化して出荷することを前提に、多めにコアを用意したと考えれば理解はしやすい。
これに引き続き2013年には57コアとし、その分動作周波数を1.1GHzに引き上げてバランスを取ったXeon Phi 3100シリーズと、本当にハイエンド、要するにTOP500での上位ランキング狙い向けに有効コア数を61とし、さらに動作周波数を1.238GHzまで引き上げたXeon Phi 7100シリーズもラインナップする。
ちなみに搭載メモリー量も、Xeon Phi 3100シリーズは6GB、5100シリーズは8GB、7100シリーズは16GBと差がついており、このあたりでラインナップ分けがされている。
2012年11月のTOP500のリストでは、テキサス大のアドバンスド・コンピューティング・センターに納入されたStampedeというシステムが実効性能2.66TFLOPSで7位にランクインしている。
このシステムは当初Xeon Phi 5110Pをベースに構築されていたが、後にXeon Phi 7120Pに入れ替えと増設を行ない、実効性能5.17TFLOPSで2015年6月のリストでも8位にランクインしているシステムだ。
余談だが、テキサス大はこのシステム更新を2012年から2013年にかけて行なったのだが、当時まだインテルは7100シリーズを発表していなかった。このため、このカードはXeon Phi SE10Pという“Special Edition”扱いされている。
また、2013年11月のTOP500では、中国の国防科学技術大学(NUDT)に設置されたTianhe-2(天河二号)は実効性能33.86TFLOPSでTOP500の1位を獲得、以後ずーっと1位の座を占め続けている。このシステムは32000個のIvuBridge-EPベースXeonと、48000枚のXeon Phiカードから構成されている。
2013年11月のリストでは、上位100位のうち9システムがXeon Phiをベースとしており、2014年6月はこれが10システム、2014年11月は11システム、2015年6月は12システムと、ゆっくりと勢力を増やしているのがわかる。
これはあくまで上位100位のシステムの話だから、もっと下位まで調べると変動はもう少し大きくなる。こうした形で、インテルは現在のHPC市場にがっちり食い込むことに成功した、として良いだろう。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ