高性能だが発売が遅すぎた
FirePro Sシリーズ
ということで本題である。旧AMD Stream、現AMD FirePro Sシリーズのラインナップであるが、こちらもRadeonの新製品が出ると、後追いで投入されてきた。まずAMD FireStreamでは、以下の製品がラインナップされた。
AMD FireStreamのラインナップ | |
---|---|
型番 | 対応ビデオカード |
FireStream(型番無し) | Radeon X1900 XTX |
FireStream 9170 | Radeon HD 3870 |
FireStream 9250/9270 | Radeon HD 4850/4870 |
FireStream 9350/9370 | Radeon HD 5850/5870 |
実はこれらの製品、ハードウェアとしての競争力はそう悪いものではなかった。例えば2007年11月に発売されたFireStream 9170は単精度で512GFLOPS、倍精度でも102.4GFLOPSという性能であり、NVIDIAの初代Tesla(C870)と比べると単精度では同等、倍精度はTeslaが未サポートなのでこれだけ比較すればFireStream 9170の勝ちである。
あるいは2008年にリリースされたFireStream 9270は単精度1200GFLOPS、倍精度240GFLOPSだったため、2009年に投入されたFermiベースのTesla C2070(単精度1030GFLOPS、倍精度515GFLOPS)に極端に見劣りするという程でもない。
続くFireStream 9370では単精度2640GFLOPS、倍精度528GFLOPSに引き上げられたため、ここで完璧にTesla C2070に追いついた形になる。
性能だけ見れば悪くないFireStreamの足を引っ張ったのはソフトウェア側である。これも連載310回で説明したが、Stream SDKの使いにくさは普及の阻害条件になった。もっと悪かったのは、Stream SDKが動くプラットフォームが限られていたことだ。
CUDAの方は、まず普通にビデオカードで実装や検証を行ない、それで性能の確認などが済んだところが大挙してTeslaを購入し、爆発的に普及した。対してATI/AMDはここでStream SDKが動く機種を限定してしまい、結局Stream SDKはほとんど使われずに終わってしまった。
ただAMDとしてはむしろ途中からOpenCLに力を入れていたため、Stream SDKはある意味どうでもよかったのかもしれない。ところが、OpenCLは正式に1.0が発表されたのは2008年12月のこと。これに対応したOpenCL DriverがAMDから公開されたのは2009年末のCatalyst 9.12のHotFixであり、それまではSDKこそ入手できても実際にテストできない状態が続いた。
つまるところ、CUDAからほぼ2年遅れでOpenCLが普通に入手して評価、実装できる状態になったわけだ。そしてこの2年の遅れは普及には致命的な影響を及ぼした。
加えてAMDは、Fusionという名前でCPUとGPUの普及を目論見、OpenCLはその有力な武器であったが、逆に言えばHPC向けの外付けGPUはこのFusionの範囲外とされた。
このあたりは純粋にAMDの資産が限られており、両方をカバーはできなかったということでもあるのだが、そんなわけでHPC市場からは「AMDはHPCに注力していない」とみなされるようになったのは致し方ないところか。
実際HPC市場に注力したとしても、その結果の売り上げがコストに見合うほどなのかは微妙なところがある。
この後もAMDはFirePro SシリーズとしてGPGPU向け製品の提供を続けているが、TOP500のリストではあまり目立った位置にはいない。直近の2015年6月のリストでは、サウジアラビアのKACST(King Abdulaziz City for Science and Technology)のSANAMが、FirePro S10000を利用したシステムで124位である。
そして、ワルシャワ大学のNGSC(Next Generation Sequencing Center)に納入されたORIONが、150台のPowerEdge R730サーバーにそれぞれ2枚のFirePro S9150を組み合わせた構成で380位を獲得している程度である。
むしろ昨年11月のGreen500で、ドイツのGSI(Helmholtzzentrum fur Schwerionenforschung GmbH:重イオン研究所)に設置されたL-CSCで、3GHz駆動のXeon E5-2690v2ベースのマシンにFirePro S9150を組み合わせた構成で、5271.81MFLOPS/Wを実現して堂々1位を実現している方が有名かもしれない。
ただこれもFireProだから実現できたとも言い切れない部分で、実際2位はPEZY-SC、3位以下は軒並みNVIDIAのTeslaベースになっており、その結果を見ると次回以降もFireProがTOPをキープできるかは怪しい。
OpenCLをベースにHPCシステムを構築しているサイトにとっては、同社のFireProはNVIDIAのTeslaに対する良い対抗製品として選択可能だが、問題はそうしたサイトがあまりないということで、こればっかりは短期的にはどうにもならない。
AMDの現在の体力を考えると、HPC市場に働きかけてCUDAベースのアプリケーションをOpenCLベースに置き換えていく、といったプロモーションを大々的に行なうのは不可能であり、引き続きOpenCLを使っているところに提供するといった、消極的な展開が続いていくと思われる。
※お詫びと訂正:Xeonの製品名に誤りがございました。記事を訂正してお詫びいたします。(2015年7月21日)
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ