高性能だが発売が遅すぎた
FirePro Sシリーズ
ということで本題である。旧AMD Stream、現AMD FirePro Sシリーズのラインナップであるが、こちらもRadeonの新製品が出ると、後追いで投入されてきた。まずAMD FireStreamでは、以下の製品がラインナップされた。
AMD FireStreamのラインナップ | |
---|---|
型番 | 対応ビデオカード |
FireStream(型番無し) | Radeon X1900 XTX |
FireStream 9170 | Radeon HD 3870 |
FireStream 9250/9270 | Radeon HD 4850/4870 |
FireStream 9350/9370 | Radeon HD 5850/5870 |
実はこれらの製品、ハードウェアとしての競争力はそう悪いものではなかった。例えば2007年11月に発売されたFireStream 9170は単精度で512GFLOPS、倍精度でも102.4GFLOPSという性能であり、NVIDIAの初代Tesla(C870)と比べると単精度では同等、倍精度はTeslaが未サポートなのでこれだけ比較すればFireStream 9170の勝ちである。
あるいは2008年にリリースされたFireStream 9270は単精度1200GFLOPS、倍精度240GFLOPSだったため、2009年に投入されたFermiベースのTesla C2070(単精度1030GFLOPS、倍精度515GFLOPS)に極端に見劣りするという程でもない。
続くFireStream 9370では単精度2640GFLOPS、倍精度528GFLOPSに引き上げられたため、ここで完璧にTesla C2070に追いついた形になる。
性能だけ見れば悪くないFireStreamの足を引っ張ったのはソフトウェア側である。これも連載310回で説明したが、Stream SDKの使いにくさは普及の阻害条件になった。もっと悪かったのは、Stream SDKが動くプラットフォームが限られていたことだ。
CUDAの方は、まず普通にビデオカードで実装や検証を行ない、それで性能の確認などが済んだところが大挙してTeslaを購入し、爆発的に普及した。対してATI/AMDはここでStream SDKが動く機種を限定してしまい、結局Stream SDKはほとんど使われずに終わってしまった。
ただAMDとしてはむしろ途中からOpenCLに力を入れていたため、Stream SDKはある意味どうでもよかったのかもしれない。ところが、OpenCLは正式に1.0が発表されたのは2008年12月のこと。これに対応したOpenCL DriverがAMDから公開されたのは2009年末のCatalyst 9.12のHotFixであり、それまではSDKこそ入手できても実際にテストできない状態が続いた。
つまるところ、CUDAからほぼ2年遅れでOpenCLが普通に入手して評価、実装できる状態になったわけだ。そしてこの2年の遅れは普及には致命的な影響を及ぼした。
加えてAMDは、Fusionという名前でCPUとGPUの普及を目論見、OpenCLはその有力な武器であったが、逆に言えばHPC向けの外付けGPUはこのFusionの範囲外とされた。
このあたりは純粋にAMDの資産が限られており、両方をカバーはできなかったということでもあるのだが、そんなわけでHPC市場からは「AMDはHPCに注力していない」とみなされるようになったのは致し方ないところか。
実際HPC市場に注力したとしても、その結果の売り上げがコストに見合うほどなのかは微妙なところがある。
この後もAMDはFirePro SシリーズとしてGPGPU向け製品の提供を続けているが、TOP500のリストではあまり目立った位置にはいない。直近の2015年6月のリストでは、サウジアラビアのKACST(King Abdulaziz City for Science and Technology)のSANAMが、FirePro S10000を利用したシステムで124位である。
そして、ワルシャワ大学のNGSC(Next Generation Sequencing Center)に納入されたORIONが、150台のPowerEdge R730サーバーにそれぞれ2枚のFirePro S9150を組み合わせた構成で380位を獲得している程度である。
むしろ昨年11月のGreen500で、ドイツのGSI(Helmholtzzentrum fur Schwerionenforschung GmbH:重イオン研究所)に設置されたL-CSCで、3GHz駆動のXeon E5-2690v2ベースのマシンにFirePro S9150を組み合わせた構成で、5271.81MFLOPS/Wを実現して堂々1位を実現している方が有名かもしれない。
ただこれもFireProだから実現できたとも言い切れない部分で、実際2位はPEZY-SC、3位以下は軒並みNVIDIAのTeslaベースになっており、その結果を見ると次回以降もFireProがTOPをキープできるかは怪しい。
OpenCLをベースにHPCシステムを構築しているサイトにとっては、同社のFireProはNVIDIAのTeslaに対する良い対抗製品として選択可能だが、問題はそうしたサイトがあまりないということで、こればっかりは短期的にはどうにもならない。
AMDの現在の体力を考えると、HPC市場に働きかけてCUDAベースのアプリケーションをOpenCLベースに置き換えていく、といったプロモーションを大々的に行なうのは不可能であり、引き続きOpenCLを使っているところに提供するといった、消極的な展開が続いていくと思われる。
※お詫びと訂正:Xeonの製品名に誤りがございました。記事を訂正してお詫びいたします。(2015年7月21日)
この連載の記事
-
第775回
PC
安定した転送速度を確保できたSCSI 消え去ったI/F史 -
第774回
PC
日本の半導体メーカーが開発協力に名乗りを上げた次世代Esperanto ET-SoC AIプロセッサーの昨今 -
第773回
PC
Sound Blasterが普及に大きく貢献したGame Port 消え去ったI/F史 -
第772回
PC
スーパーコンピューターの系譜 本格稼働で大きく性能を伸ばしたAuroraだが世界一には届かなかった -
第771回
PC
277もの特許を使用して標準化した高速シリアルバスIEEE 1394 消え去ったI/F史 -
第770回
PC
キーボードとマウスをつなぐDINおよびPS/2コネクター 消え去ったI/F史 -
第769回
PC
HDDのコントローラーとI/Fを一体化して爆発的に普及したIDE 消え去ったI/F史 -
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ - この連載の一覧へ