商業的に成功した
XT3の後継TX4
XT3の後継となるのがXT4である。XT3とXT4の違いは、プロセッサーが90nm世代のItalyコア(Socket 940/DDR SDRAM対応)から90/65nm世代のSanta Rosa/Butapestコア(Socket F/DDR2 SDRAM対応)に変更されたことと、ノード間接続が従来のSeaStarからSeaStar2に変更されたことの2点である。
まずプロセッサーに関して言えば、Italy世代が95WのTDPで最大2.6GHz駆動のデュアルコアだったのに対し、Santa Rosa世代では同じ95W TDP枠で3GHzまで動作周波数を引き上げた。Barcelonaでは2.3GHzまで動作周波数は落ちたもののコア数は倍増になったため、ノードあたりの計算能力は1.8倍になる。
また、対応メモリーがDDR2-SDRAMとなったので、メモリー帯域は単純に倍増しており、メモリーアクセスを多用する計算における性能の底上げが図られることになった。
一方のSeaStar2だが、基本的な構成はSeaStarと変わらない。スペックの違いは主にSeaStarのASICとOpteronをつなぐハイパートランスポート・リンクのI/Fであり、初期のSeaStarは6.4GB/秒の双方向ながら実効帯域が2.17GB/秒だったのに対し、SeaStar2ではここが8GB/秒に底上げされている。
このXT4は、XT3からのアップグレードという形で利用されたケースも多かった。例えばオークリッジ国立研究所のJagureは2005年にXT3ベースで構築されたが、2006年末にXT4ベースにアップグレードされており、2007年6月のTOP500では101.7TFLOPSをたたき出して2位の座を確保している。2007年11月のTOP500の上位100位を見てみると以下のところが早くもXT4を導入している。
2007年11月のTOP500で、上位100位以内にあるXT4 | ||||||
---|---|---|---|---|---|---|
順位 | 組織 | システム名 | 実効性能 | |||
7位 | オークリッジ国立研究所 | Jagure | 101.7TFLOPS | |||
9位 | 米エネルギー省科学局 ローレンス・バークレー国立研究所 国立エネルギー研究科学計算センター |
Franklin | 85.4TFLOPS | |||
17位 | エジンバラ大 | HECToR | 54.6TFLOPS |
また、RedStormも2008年には一部をXT4相当に置き換えており(関連記事)、XT4も、それなりに商業的に成功したモデルとして差し支えはないだろう。
TX4の性能を向上させたTX5
液冷オプションも追加
このXT4をさらに強化したのが、2007年に発表されたXT5シリーズである。XT4からの変更点は以下の4点。
- プロセッサーコアはXT4と同様にOpteron 2000シリーズのクワッドコアを利用するが、1つのコンピュートノードに2つのOpteronコアがぶら下る。
- 4つのコンピュートノードをまとめて1枚のブレードに収めた
- インターコネクトはSeaStar2+にアップグレード
- 空冷以外に水冷オプションが用意された
まずプロセッサーについては、当初こそBarcelonaコアで動作周波数が上がらずに苦闘していたが、続いて投入された45nmプロセスであるShanghaiベースの4コア、あるいはIstanburベースの6コアOpteronを利用することで動作周波数の引き上げができるようになった。
あるいは動作周波数を落とさずに消費電力を下げられたことで、とりあえず性能面での問題は一段落した感がある。
また、この世代では2つのOpteronをハイパートランスポート・リンクでつなぎ、その対の片方にのみSeaStar ASICをつなぐことでプロセッサーの密度を引き上げている。
下の画像がXT5ブレードと呼ばれるものだが、こんな具合に8つのプロセッサーと32本のDIMMスロット、それと4つのSeaStar2+ ASICをまとめて1枚のブレードに収めることで実装密度を高めている。
ただ実装密度を引き上げると放熱の問題が当然出てくることになるが、これに対してXT5では従来の空冷に加えて液冷オプションも提供している。
SeaStar2+そのものは従来の構造と大きくは変わらない。ただし、SeaStar同士のリンクが7.6GB/秒から9.6GB/秒に引き上げられているのがSeaStar2との相違点となる。
XT5もやはりそれなりに広く利用された。2009年6月のTOP500の上位100位を見てみると以下のとおり、CRAY自身のものを除外しても結構な台数がこの時点で既に運用されていることがわかる。
2009年6月のTOP500で、上位100位以内にあるXT5 | ||||||
---|---|---|---|---|---|---|
順位 | 組織 | システム名 | 実効性能 | |||
2位 | オークリッジ国立研究所 | Jagure | 1059.0TFLOPS | |||
6位 | 米海軍犯罪捜査局/テネシー大 | Kraken | 463.3TFLOPS | |||
23位 | Swiss National Supercomputing Centre | Monte Rosa | 117.6TFLOPS | |||
39位 | NOO/NAVO | 90.8TFLOPS | ||||
48位 | 米陸軍研究所 | 76.8TFLOPS | ||||
57位 | CRAY | Shark | 67.8TFLOPS |
特にオークリッジ国立研究所は継続的にJagureをアップグレードしており、2005年から2009年の間に15.2TFLOPS→1059TFLOPSまで性能を引き上げている。
ちなみにXT5には、XD1とよく似たOpteron+FPGA構成のCRAY XR1ブレード、それとCRAYが従来からサポートしてきたベクトル方式を継承した「CRAY X2」という独自プロセッサーを搭載したX2ブレードも用意され、これらを混在させることも可能だった。
またSeaStar2+のリンクを4本に制限し、2次元構造のメッシュ接続とした低価格モデルのCRAY XT5mというモデルも後追いで追加されている。
→次のページヘ続く (現在の最高性能のマシンCielo)
この連載の記事
-
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU -
第791回
PC
妙に性能のバランスが悪いマイクロソフトのAI特化型チップMaia 100 Hot Chips 2024で注目を浴びたオモシロCPU -
第790回
PC
AI推論用アクセラレーターを搭載するIBMのTelum II Hot Chips 2024で注目を浴びたオモシロCPU -
第789回
PC
切り捨てられた部門が再始動して作り上げたAmpereOne Hot Chips 2024で注目を浴びたオモシロCPU -
第788回
PC
Meteor Lakeを凌駕する性能のQualcomm「Oryon」 Hot Chips 2024で注目を浴びたオモシロCPU -
第787回
PC
いまだに解決しないRaptor Lake故障問題の現状 インテル CPUロードマップ - この連載の一覧へ