このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第308回

スーパーコンピューターの系譜 GPUをアクセラレーターに活用したClearSpeed

2015年06月15日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

世界初のGPUを使ったアクセラレーター
「CS301」

 FUZION 1が製品化されることはなかったが、ここでPixelFusion自身は戦略を転換することにしたらしい。同社は社名を2002年にClearSppedに変更。いきなりSIMDベースのプロセッサーを製造するビジネスに転換する。SC2003(Supercomputing Conference 2003)において、CS301というアクセラレーターを公開する。

 CS301は内部構造をだいぶ変更した。引き続きPE(Processing Element)が複数同時に動く仕組みは変わらないが、プロセス微細化の足枷になっていたeDRAMを排除、構造もすっきりさせ、アクセラレーターに不要なものを取り去った。

CS301の内部構造。ClearSpeedの2003年のプレゼンテーションより。これはSC2003で公開された後で若干手を入れたものらしい。最大1000PEと書いてあるが、CS301そのものは64PE構成である

 PEそのものも強化されるとともに、FPUやMACユニットを追加することで浮動小数点演算性能を大幅に強化した。

CS301のPE。Register FileとALU/FPU/MACの間は32bit幅になっているので、原則は単精度演算で、倍精度は2つのPEを組み合わせてサポートすると思われる

 このあたりはFUZION 1は「プログラム次第でどんなフォーマットでも対応できる」形だったが、アクセラレーター用途であればIEEE754フォーマットが一番便利なので、これにハードウェアを合わせた形だ。

 もっとも8~32bitの固定小数点演算フォーマットなどもサポートされているあたりは、かならずしもHPC向けだけでビジネスが成立するか不安だったので、他の用途も探していた気配がうかがえる。

 消費電力は最悪でも3Wと低めで、200MHz駆動で最大25.6GFLOPS(ただし単精度)という演算性能は、同時期の競合製品と比較して十分高速だった。

CS301のダイ。製造はIBMの0.13μ FSGプロセスを用い、ダイサイズは72平方mmに納まっていた

 この時ClearSpeedはいくつかのプロセッサーとの比較を行なっているが、例えばPowerPC 7410とFFTを行なった場合のスコアが下の画像だ。

CS301をPowerPC 7410と比較したデータ。性能/消費電力比が、通常のFFTの場合で18.6倍、FFTを用いたパルス圧縮を行なうと約32倍もの性能差になるとしている

 ちなみに当時といえばまだインテルならPentium 4が現役の時代だったが、こちらは3GHz駆動で12GFLOPSであり、性能/消費電力比で言うとPentium 4は0.1GFLOPS/Wに対して、CS301は8.5GFLOPS/Wと大幅に性能が高いことをアピールしていた。

 このCS301はPCの拡張カード以外にCard Busのフォーマットまで考えていたらしい。

Card Busまで構想にあったCS301。確かに2Wの消費電力ならCardBusの拡張カードでも収まるだろうが、I/Fがウェイトの入りまくりなCard Busではおそらく性能は出なかっただろう

 当初は開発環境と開発ボード、サンプルチップ類を2003年第4四半期に提供という話だったのだが、実際にはこのタイミングではチップが出荷できなかったようで、同社自身もCS301の次の製品であるCSX600に注力するようになる。

 理由は明確には述べられていないが、1つはもう少し高い性能が要求されたこと、もう1つはやはり倍精度浮動小数点演算が求められたらしい。

→次のページヘ続く (CS301の後継「CSX600」

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン