メモリーがDDR3に切り替わった
CRAY TX6
XT5の後継となるのが2009年に発表されたXT6である。XT5との相違点は、プロセッサーがSocket Fベースのものから、Socket C32/G34のOpteron 6000シリーズになったことである。
これにともないメモリーもDDR3に切り替わっている。ただしインターコネクトは引き続きSeaStar2+であり、その意味ではブレード以外の構成要素は基本的にXT5と同じであるため、XT5からXT6へのアップグレードも容易であった。
またXT5mの後継として、XT6mも同時に提供されている。ただ、XT6はCRAYが期待したほどには売れなかったようだ。2010年6月の場合、TOP500にランクインしているのは以下のとおりだ。
2010年6月のTOP500で、上位100位以内にあるXT6 | ||||||
---|---|---|---|---|---|---|
順位 | 組織 | システム名 | 実効性能 | |||
16位 | エジンバラ大 | HECToR | 274.7TFLOPS | |||
76位 | スウェーデン王立工科大学 | 75.1TFLOPS | ||||
97位 | CRAY | Tuna | 53.2TFLOPS |
スウェーデンのシステムはXT6mである。その他の既存のXT5ユーザーはというと、例えばオークリッジ国立研究所は6コア2.6GHzのOpteronを搭載したCRAY XT5-HEに切り替えて凌いでおり、実際この2010年6月には1759.0TFLOPSでTOP500の1位を獲得している。
このCRAY XT5-HEを選んだユーザーは他にもいくつかある。次の2010年11月のリストを見ると、このXT6をスキップして後継のXE6を選んだところが少なくない。
現在の最高性能のマシン
Cielo
ということで、いよいよ本題のXE6である。基本的な構造はXT6と同じだが、大きな違いはインターコネクトにSeaStarに代えてGeminiを採用したことだ。
下の写真がGeminiの構成だが、4つのOpteronプロセッサーをまとめて接続でき、また外部リンクを10本(それぞれ9.3GB/秒)持つ構成である。ハイパートランスポート・リンクも10.4GB/秒に引き上げられている。
CRAYによればこのGeminiでは10万ノードを超えるシステムを構築するのが目的としており、これに向けてSeaStarを大規模に拡張したのがGeminiというわけだ。
これにあわせて、XE6ブレードも若干違いが見られる。ただし違いがあるのはそれだけであり、後はほぼXT6と同じ構成になっている。
XE6が発表されたのは2010年5月であるが、これに先立つ2010年4月に国家核安全保障局はCRAYとの間でこのXE6ベースでCieloを構築する契約を結ぶ(関連リンク)。契約金額は5400万ドル未満で、2010年の第3四半期から設置を開始し、2011年には運用を開始している。
最終的な構成は8コア/2.4GHz駆動のOpteron 6136をベースとした14万2272コア(つまりプロセッサー数は1万7784個)の構成。性能は1110TFLOPSで、理論性能の1365.8TFLOPSと比較して81.3%もの効率を誇っており、これだけの大規模システムとしてはかなり高いとしてよい。
ただその一方で消費電力は3980KWに達しており、343.1KFLOPS/Wというのは、RoadRunnerあたりと比較する分にはいいのだが、BlueGene/Qなどと比較するとかなり分が悪いのは事実である。
ただロスアラモス国立研究所は現状このCieloが最高性能のマシンであり、今しばらくの間は運用が続くと思われる。
ちなみにCRAYは、XE6ブレードにNVIDIAのTesla X2090を組み合わせたCRAY XK6やTesla K20を組み合わせたCRAY XK7などをリリースする。
さすがにAMDのOpteronシリーズのアップデートがなくなったこともあり、アーキテクチャーをインテルのXeonに鞍替えしてCRAY XCあるいはCRAY CSというラインナップをメインに据えており、すでにAMDベースのXT/XEシリーズは「過去の製品」扱いとなっているのは致し方ないだろう。

この連載の記事
-
第813回
PC
Granite Rapid-DことXeon 6 SoCを12製品発表、HCCとXCCの2種類が存在する インテル CPUロードマップ -
第812回
PC
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC IEDM 2024レポート -
第811回
PC
Panther Lakeを2025年後半、Nova Lakeを2026年に投入 インテル CPUロードマップ -
第810回
PC
2nmプロセスのN2がTSMCで今年量産開始 IEDM 2024レポート -
第809回
PC
銅配線をルテニウム配線に変えると抵抗を25%削減できる IEDM 2024レポート -
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート -
第804回
PC
AI向けシステムの課題は電力とメモリーの膨大な消費量 IEDM 2024レポート -
第803回
PC
トランジスタの当面の目標は電圧を0.3V未満に抑えつつ動作効率を5倍以上に引き上げること IEDM 2024レポート - この連載の一覧へ