Xeonブランドで登場した
Knights Corner
こうした準備期間を経て、2012年にインテルはKnights Cornerベースの製品をXeon Phiとして発売する。
実は2011年のISCの会場で、インテルは単にKnights Ferryの性能をアピールするだけではなく、Knights Cornerのチップのデモや、DGEMM(倍精度の行列演算)で1TFLOPSを超える性能があることをアピールしていた。ただこの時はまだ製品発表には至っていない。
製品が発表されたのは2012年6月のことで、この時にはISC 12にあわせてXeon Phiという新しい製品ブランドを発表した。
内部の詳細については、同じく2012年8月に開催されたHotChips 24で明らかにされている。といっても、この時点ではまだコア数は50以上というだけで厳密なコア数は示されなかった。
ただ同時に発表されたKnights Cornerのダイ写真から、最大62コアであることは推察がついた。
内部構造は相変わらずリングバスを使って相互接続する方式で、コアの内部構造は(プロセス微細化以外は)Knights Ferryと同じこと、Vector ALUは引き続き16-wideの構造になっていることが示されている。
おもしろいのが下の画像で、これは2012年6月のTOP500のリストから、3社のアクセラレーターを使った場合の性能/消費電力比のトップを並べたものである。
ここでインテルが社内に構築したDiscoveryというシステムは118.6TFLOPSを100.80KWで実現しており、バルセロナ・スーパーコンピューター・センターが構築したBULLX B505ベースのシステムの103.2TFLOPS/81.50KWや、長崎大学のDEGIMA クラスターの64.8TFLOPS/47.05KWと比べても、より高い性能/消費電力比が得られると主張していることだ。
単に性能/消費電力だけでなく、勢力的にも無視できない規模になった。2012年6月のTOP500リストの中には44システムがXeon Phiベースとしてランクインしている。
ただまだこの時点ではXeon Phiの生産がそれほど十分ではなかったのだろう。どのサイトも限られた数のXeon Phiしか搭載しておらず、最高性能を出したシステムは上に出てきたインテルのDiscoveryの150位となっているのは、仕方ないところであろう。
なお、この時点ではまだ公式な意味での出荷は開始されていない。したがってインテルを含む44のシステムは、いずれも正式出荷前の製品をベースにシステムを構築した形だ。正式出荷が始まったのは2012年末のことで、まずはXeon Phi 5110Pが出荷される。
この製品は60コア構成で、動作周波数は1.053GHz、メモリー8GBというもの。コアそのものは全部で62個あるが、うち2つは冗長化した(無効化した)形での出荷となっている。
今もってインテルはKnights Cornerのダイサイズを発表していないのだが、世の中には製品版のXeon Phiを買ってヒートスプレッダーを引っぺがした猛者の方がおられ(関連リンク)、この方の実測によれば720mm2に達するとしている。
これだけ大きければ欠陥が多少生じるのは止むを得ないところで、欠陥がある部位を無効化して出荷することを前提に、多めにコアを用意したと考えれば理解はしやすい。
これに引き続き2013年には57コアとし、その分動作周波数を1.1GHzに引き上げてバランスを取ったXeon Phi 3100シリーズと、本当にハイエンド、要するにTOP500での上位ランキング狙い向けに有効コア数を61とし、さらに動作周波数を1.238GHzまで引き上げたXeon Phi 7100シリーズもラインナップする。
ちなみに搭載メモリー量も、Xeon Phi 3100シリーズは6GB、5100シリーズは8GB、7100シリーズは16GBと差がついており、このあたりでラインナップ分けがされている。
2012年11月のTOP500のリストでは、テキサス大のアドバンスド・コンピューティング・センターに納入されたStampedeというシステムが実効性能2.66TFLOPSで7位にランクインしている。
このシステムは当初Xeon Phi 5110Pをベースに構築されていたが、後にXeon Phi 7120Pに入れ替えと増設を行ない、実効性能5.17TFLOPSで2015年6月のリストでも8位にランクインしているシステムだ。
余談だが、テキサス大はこのシステム更新を2012年から2013年にかけて行なったのだが、当時まだインテルは7100シリーズを発表していなかった。このため、このカードはXeon Phi SE10Pという“Special Edition”扱いされている。
また、2013年11月のTOP500では、中国の国防科学技術大学(NUDT)に設置されたTianhe-2(天河二号)は実効性能33.86TFLOPSでTOP500の1位を獲得、以後ずーっと1位の座を占め続けている。このシステムは32000個のIvuBridge-EPベースXeonと、48000枚のXeon Phiカードから構成されている。
2013年11月のリストでは、上位100位のうち9システムがXeon Phiをベースとしており、2014年6月はこれが10システム、2014年11月は11システム、2015年6月は12システムと、ゆっくりと勢力を増やしているのがわかる。
これはあくまで上位100位のシステムの話だから、もっと下位まで調べると変動はもう少し大きくなる。こうした形で、インテルは現在のHPC市場にがっちり食い込むことに成功した、として良いだろう。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











