高性能だが発売が遅すぎた
FirePro Sシリーズ
ということで本題である。旧AMD Stream、現AMD FirePro Sシリーズのラインナップであるが、こちらもRadeonの新製品が出ると、後追いで投入されてきた。まずAMD FireStreamでは、以下の製品がラインナップされた。
| AMD FireStreamのラインナップ | |
|---|---|
| 型番 | 対応ビデオカード |
| FireStream(型番無し) | Radeon X1900 XTX |
| FireStream 9170 | Radeon HD 3870 |
| FireStream 9250/9270 | Radeon HD 4850/4870 |
| FireStream 9350/9370 | Radeon HD 5850/5870 |
実はこれらの製品、ハードウェアとしての競争力はそう悪いものではなかった。例えば2007年11月に発売されたFireStream 9170は単精度で512GFLOPS、倍精度でも102.4GFLOPSという性能であり、NVIDIAの初代Tesla(C870)と比べると単精度では同等、倍精度はTeslaが未サポートなのでこれだけ比較すればFireStream 9170の勝ちである。
あるいは2008年にリリースされたFireStream 9270は単精度1200GFLOPS、倍精度240GFLOPSだったため、2009年に投入されたFermiベースのTesla C2070(単精度1030GFLOPS、倍精度515GFLOPS)に極端に見劣りするという程でもない。
続くFireStream 9370では単精度2640GFLOPS、倍精度528GFLOPSに引き上げられたため、ここで完璧にTesla C2070に追いついた形になる。
性能だけ見れば悪くないFireStreamの足を引っ張ったのはソフトウェア側である。これも連載310回で説明したが、Stream SDKの使いにくさは普及の阻害条件になった。もっと悪かったのは、Stream SDKが動くプラットフォームが限られていたことだ。
CUDAの方は、まず普通にビデオカードで実装や検証を行ない、それで性能の確認などが済んだところが大挙してTeslaを購入し、爆発的に普及した。対してATI/AMDはここでStream SDKが動く機種を限定してしまい、結局Stream SDKはほとんど使われずに終わってしまった。
ただAMDとしてはむしろ途中からOpenCLに力を入れていたため、Stream SDKはある意味どうでもよかったのかもしれない。ところが、OpenCLは正式に1.0が発表されたのは2008年12月のこと。これに対応したOpenCL DriverがAMDから公開されたのは2009年末のCatalyst 9.12のHotFixであり、それまではSDKこそ入手できても実際にテストできない状態が続いた。
つまるところ、CUDAからほぼ2年遅れでOpenCLが普通に入手して評価、実装できる状態になったわけだ。そしてこの2年の遅れは普及には致命的な影響を及ぼした。
加えてAMDは、Fusionという名前でCPUとGPUの普及を目論見、OpenCLはその有力な武器であったが、逆に言えばHPC向けの外付けGPUはこのFusionの範囲外とされた。
このあたりは純粋にAMDの資産が限られており、両方をカバーはできなかったということでもあるのだが、そんなわけでHPC市場からは「AMDはHPCに注力していない」とみなされるようになったのは致し方ないところか。
実際HPC市場に注力したとしても、その結果の売り上げがコストに見合うほどなのかは微妙なところがある。
この後もAMDはFirePro SシリーズとしてGPGPU向け製品の提供を続けているが、TOP500のリストではあまり目立った位置にはいない。直近の2015年6月のリストでは、サウジアラビアのKACST(King Abdulaziz City for Science and Technology)のSANAMが、FirePro S10000を利用したシステムで124位である。
そして、ワルシャワ大学のNGSC(Next Generation Sequencing Center)に納入されたORIONが、150台のPowerEdge R730サーバーにそれぞれ2枚のFirePro S9150を組み合わせた構成で380位を獲得している程度である。
むしろ昨年11月のGreen500で、ドイツのGSI(Helmholtzzentrum fur Schwerionenforschung GmbH:重イオン研究所)に設置されたL-CSCで、3GHz駆動のXeon E5-2690v2ベースのマシンにFirePro S9150を組み合わせた構成で、5271.81MFLOPS/Wを実現して堂々1位を実現している方が有名かもしれない。
ただこれもFireProだから実現できたとも言い切れない部分で、実際2位はPEZY-SC、3位以下は軒並みNVIDIAのTeslaベースになっており、その結果を見ると次回以降もFireProがTOPをキープできるかは怪しい。
OpenCLをベースにHPCシステムを構築しているサイトにとっては、同社のFireProはNVIDIAのTeslaに対する良い対抗製品として選択可能だが、問題はそうしたサイトがあまりないということで、こればっかりは短期的にはどうにもならない。
AMDの現在の体力を考えると、HPC市場に働きかけてCUDAベースのアプリケーションをOpenCLベースに置き換えていく、といったプロモーションを大々的に行なうのは不可能であり、引き続きOpenCLを使っているところに提供するといった、消極的な展開が続いていくと思われる。
※お詫びと訂正:Xeonの製品名に誤りがございました。記事を訂正してお詫びいたします。(2015年7月21日)

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











