高性能だが発売が遅すぎた
FirePro Sシリーズ
ということで本題である。旧AMD Stream、現AMD FirePro Sシリーズのラインナップであるが、こちらもRadeonの新製品が出ると、後追いで投入されてきた。まずAMD FireStreamでは、以下の製品がラインナップされた。
| AMD FireStreamのラインナップ | |
|---|---|
| 型番 | 対応ビデオカード |
| FireStream(型番無し) | Radeon X1900 XTX |
| FireStream 9170 | Radeon HD 3870 |
| FireStream 9250/9270 | Radeon HD 4850/4870 |
| FireStream 9350/9370 | Radeon HD 5850/5870 |
実はこれらの製品、ハードウェアとしての競争力はそう悪いものではなかった。例えば2007年11月に発売されたFireStream 9170は単精度で512GFLOPS、倍精度でも102.4GFLOPSという性能であり、NVIDIAの初代Tesla(C870)と比べると単精度では同等、倍精度はTeslaが未サポートなのでこれだけ比較すればFireStream 9170の勝ちである。
あるいは2008年にリリースされたFireStream 9270は単精度1200GFLOPS、倍精度240GFLOPSだったため、2009年に投入されたFermiベースのTesla C2070(単精度1030GFLOPS、倍精度515GFLOPS)に極端に見劣りするという程でもない。
続くFireStream 9370では単精度2640GFLOPS、倍精度528GFLOPSに引き上げられたため、ここで完璧にTesla C2070に追いついた形になる。
性能だけ見れば悪くないFireStreamの足を引っ張ったのはソフトウェア側である。これも連載310回で説明したが、Stream SDKの使いにくさは普及の阻害条件になった。もっと悪かったのは、Stream SDKが動くプラットフォームが限られていたことだ。
CUDAの方は、まず普通にビデオカードで実装や検証を行ない、それで性能の確認などが済んだところが大挙してTeslaを購入し、爆発的に普及した。対してATI/AMDはここでStream SDKが動く機種を限定してしまい、結局Stream SDKはほとんど使われずに終わってしまった。
ただAMDとしてはむしろ途中からOpenCLに力を入れていたため、Stream SDKはある意味どうでもよかったのかもしれない。ところが、OpenCLは正式に1.0が発表されたのは2008年12月のこと。これに対応したOpenCL DriverがAMDから公開されたのは2009年末のCatalyst 9.12のHotFixであり、それまではSDKこそ入手できても実際にテストできない状態が続いた。
つまるところ、CUDAからほぼ2年遅れでOpenCLが普通に入手して評価、実装できる状態になったわけだ。そしてこの2年の遅れは普及には致命的な影響を及ぼした。
加えてAMDは、Fusionという名前でCPUとGPUの普及を目論見、OpenCLはその有力な武器であったが、逆に言えばHPC向けの外付けGPUはこのFusionの範囲外とされた。
このあたりは純粋にAMDの資産が限られており、両方をカバーはできなかったということでもあるのだが、そんなわけでHPC市場からは「AMDはHPCに注力していない」とみなされるようになったのは致し方ないところか。
実際HPC市場に注力したとしても、その結果の売り上げがコストに見合うほどなのかは微妙なところがある。
この後もAMDはFirePro SシリーズとしてGPGPU向け製品の提供を続けているが、TOP500のリストではあまり目立った位置にはいない。直近の2015年6月のリストでは、サウジアラビアのKACST(King Abdulaziz City for Science and Technology)のSANAMが、FirePro S10000を利用したシステムで124位である。
そして、ワルシャワ大学のNGSC(Next Generation Sequencing Center)に納入されたORIONが、150台のPowerEdge R730サーバーにそれぞれ2枚のFirePro S9150を組み合わせた構成で380位を獲得している程度である。
むしろ昨年11月のGreen500で、ドイツのGSI(Helmholtzzentrum fur Schwerionenforschung GmbH:重イオン研究所)に設置されたL-CSCで、3GHz駆動のXeon E5-2690v2ベースのマシンにFirePro S9150を組み合わせた構成で、5271.81MFLOPS/Wを実現して堂々1位を実現している方が有名かもしれない。
ただこれもFireProだから実現できたとも言い切れない部分で、実際2位はPEZY-SC、3位以下は軒並みNVIDIAのTeslaベースになっており、その結果を見ると次回以降もFireProがTOPをキープできるかは怪しい。
OpenCLをベースにHPCシステムを構築しているサイトにとっては、同社のFireProはNVIDIAのTeslaに対する良い対抗製品として選択可能だが、問題はそうしたサイトがあまりないということで、こればっかりは短期的にはどうにもならない。
AMDの現在の体力を考えると、HPC市場に働きかけてCUDAベースのアプリケーションをOpenCLベースに置き換えていく、といったプロモーションを大々的に行なうのは不可能であり、引き続きOpenCLを使っているところに提供するといった、消極的な展開が続いていくと思われる。
※お詫びと訂正:Xeonの製品名に誤りがございました。記事を訂正してお詫びいたします。(2015年7月21日)
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第868回
PC
物理IPには真似できない4%の差はどこから生まれるか? RTL実装が解き放つDimensity 9500の真価 -
第867回
PC
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする -
第866回
PC
NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」 -
第865回
PC
1400WのモンスターGPU「Instinct MI350」の正体、AMDが選んだ効率を捨ててでも1.9倍の性能向上を獲る戦略 -
第864回
PC
なぜAMDはチップレットで勝利したのか? 2万ドルのウェハーから逆算する経済的合理性 -
第863回
PC
銅配線はなぜ限界なのか? ルテニウムへの移行で変わる半導体製造の常識と課題 -
第862回
PC
「ビル100階建て相当」の超難工事! DRAM微細化が限界を超え前人未到の垂直化へ突入 -
第861回
PC
INT4量子化+高度な電圧管理で消費電力60%削減かつ90%性能アップ! Snapdragon X2 Eliteの最先端技術を解説 -
第860回
PC
NVIDIAのVeraとRubinはPCIe Gen6対応、176スレッドの新アーキテクチャー搭載! 最高クラスの性能でAI開発を革新 -
第859回
デジタル
組み込み向けのAMD Ryzen AI Embedded P100シリーズはZen 5を最大6コア搭載で、最大50TOPSのNPU性能を実現 -
第858回
デジタル
CES 2026で実機を披露! AMDが発表した最先端AIラックHeliosの最新仕様を独自解説 - この連載の一覧へ











