高性能だが発売が遅すぎた
FirePro Sシリーズ
ということで本題である。旧AMD Stream、現AMD FirePro Sシリーズのラインナップであるが、こちらもRadeonの新製品が出ると、後追いで投入されてきた。まずAMD FireStreamでは、以下の製品がラインナップされた。
AMD FireStreamのラインナップ | |
---|---|
型番 | 対応ビデオカード |
FireStream(型番無し) | Radeon X1900 XTX |
FireStream 9170 | Radeon HD 3870 |
FireStream 9250/9270 | Radeon HD 4850/4870 |
FireStream 9350/9370 | Radeon HD 5850/5870 |
実はこれらの製品、ハードウェアとしての競争力はそう悪いものではなかった。例えば2007年11月に発売されたFireStream 9170は単精度で512GFLOPS、倍精度でも102.4GFLOPSという性能であり、NVIDIAの初代Tesla(C870)と比べると単精度では同等、倍精度はTeslaが未サポートなのでこれだけ比較すればFireStream 9170の勝ちである。
あるいは2008年にリリースされたFireStream 9270は単精度1200GFLOPS、倍精度240GFLOPSだったため、2009年に投入されたFermiベースのTesla C2070(単精度1030GFLOPS、倍精度515GFLOPS)に極端に見劣りするという程でもない。
続くFireStream 9370では単精度2640GFLOPS、倍精度528GFLOPSに引き上げられたため、ここで完璧にTesla C2070に追いついた形になる。
性能だけ見れば悪くないFireStreamの足を引っ張ったのはソフトウェア側である。これも連載310回で説明したが、Stream SDKの使いにくさは普及の阻害条件になった。もっと悪かったのは、Stream SDKが動くプラットフォームが限られていたことだ。
CUDAの方は、まず普通にビデオカードで実装や検証を行ない、それで性能の確認などが済んだところが大挙してTeslaを購入し、爆発的に普及した。対してATI/AMDはここでStream SDKが動く機種を限定してしまい、結局Stream SDKはほとんど使われずに終わってしまった。
ただAMDとしてはむしろ途中からOpenCLに力を入れていたため、Stream SDKはある意味どうでもよかったのかもしれない。ところが、OpenCLは正式に1.0が発表されたのは2008年12月のこと。これに対応したOpenCL DriverがAMDから公開されたのは2009年末のCatalyst 9.12のHotFixであり、それまではSDKこそ入手できても実際にテストできない状態が続いた。
つまるところ、CUDAからほぼ2年遅れでOpenCLが普通に入手して評価、実装できる状態になったわけだ。そしてこの2年の遅れは普及には致命的な影響を及ぼした。
加えてAMDは、Fusionという名前でCPUとGPUの普及を目論見、OpenCLはその有力な武器であったが、逆に言えばHPC向けの外付けGPUはこのFusionの範囲外とされた。
このあたりは純粋にAMDの資産が限られており、両方をカバーはできなかったということでもあるのだが、そんなわけでHPC市場からは「AMDはHPCに注力していない」とみなされるようになったのは致し方ないところか。
実際HPC市場に注力したとしても、その結果の売り上げがコストに見合うほどなのかは微妙なところがある。
この後もAMDはFirePro SシリーズとしてGPGPU向け製品の提供を続けているが、TOP500のリストではあまり目立った位置にはいない。直近の2015年6月のリストでは、サウジアラビアのKACST(King Abdulaziz City for Science and Technology)のSANAMが、FirePro S10000を利用したシステムで124位である。
そして、ワルシャワ大学のNGSC(Next Generation Sequencing Center)に納入されたORIONが、150台のPowerEdge R730サーバーにそれぞれ2枚のFirePro S9150を組み合わせた構成で380位を獲得している程度である。
むしろ昨年11月のGreen500で、ドイツのGSI(Helmholtzzentrum fur Schwerionenforschung GmbH:重イオン研究所)に設置されたL-CSCで、3GHz駆動のXeon E5-2690v2ベースのマシンにFirePro S9150を組み合わせた構成で、5271.81MFLOPS/Wを実現して堂々1位を実現している方が有名かもしれない。
ただこれもFireProだから実現できたとも言い切れない部分で、実際2位はPEZY-SC、3位以下は軒並みNVIDIAのTeslaベースになっており、その結果を見ると次回以降もFireProがTOPをキープできるかは怪しい。
OpenCLをベースにHPCシステムを構築しているサイトにとっては、同社のFireProはNVIDIAのTeslaに対する良い対抗製品として選択可能だが、問題はそうしたサイトがあまりないということで、こればっかりは短期的にはどうにもならない。
AMDの現在の体力を考えると、HPC市場に働きかけてCUDAベースのアプリケーションをOpenCLベースに置き換えていく、といったプロモーションを大々的に行なうのは不可能であり、引き続きOpenCLを使っているところに提供するといった、消極的な展開が続いていくと思われる。
※お詫びと訂正:Xeonの製品名に誤りがございました。記事を訂正してお詫びいたします。(2015年7月21日)
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ