このページの本文へ

AMD、“Torrenza”の現状と対応システムを披露

2007年03月15日 01時59分更新

文● 編集部 小西利明

  • この記事をはてなブックマークに追加
  • 本文印刷

日本エイ・エム・ディ(株)は14日、東京都内の本社にて記者説明会を開催し、米AMD社が進める専用アクセラレーターによる高速演算技術“Torrenza”(トレンザ)の概況と、同社製CPUに専用アクセラレーターを組み合わせた演算処理のデモを披露した。

HTXスロット用計算アクセラレーターカード『RCHTX-XV4』

“Torrenza”に対応したHTXスロット用計算アクセラレーターカード『RCHTX-XV4』。2つのザイリンクス社製FPGAを搭載

デビッド・リッチ氏

米AMD Commercial Solutions担当ディレクターのデビッド・リッチ氏

AMDでは、CPUコアとは別に、特定用途向けのアクセラレーターをコンピューター内に実装する“アクセラレーテッドコンピューティング”を2006年に発表し、技術開発や関連する仕様の策定などを行なっている。Torrenzaはその中でもすでに、対応アクセラレーター製品の出荷まで進んでいる技術である。説明会では、米AMD Commercial Solutions担当ディレクターのデビッド・リッチ(David Rich)氏により、Torrenzaの現状などが説明された。

まずリッチ氏はTorrenzaが必要になった背景として、CPUのスピード向上以上に処理すべきデータ量の増加スピードが速く、ギャップができてしまっていることを挙げた。特に大量の浮動小数点演算が必要な科学技術演算の類が、その例であり、そうした処理に向けて特化したアクセラレーションの可能性が、Torrenzaに結びついたという。こうした特定用途向けアクセラレーターの実現には、性能や価格、互換性などの障壁は少なくないが、同社ではTorrenzaをオープンな標準化技術を元にしたプラットフォームにすることで、これらの障壁を克服しようとしている。

リッチ氏はアクセラレーターの実装方法として、Torrenzaと“Fusion”の2種類のアプローチを説明した。まずTorrenzaは、アクセラレーターをCPUパッケージの外部に用意する、“スロット/ソケットベースのアクセラレーション”である。CPUとアクセラレーターの接続方法はさまざまで、HyperTransportをインターフェースに利用したアクセラレーター専用スロット“HTXスロット”を使うものが名高いが、チップセット~PCI Express経由で接続するものや、チップセットに内蔵するもの、別途用意されたCPUソケットにアクセラレーターを直接装着するなど、さまざまなバリエーションがある。

リッチ氏はHyperTransport経由での接続の方が、CPU同士の接続にも利用されるだけあって、汎用CPUとのレイテンシーが低い性能上の利点がある一方で、PCI Expressは実装コストが安い利点があり、Torrenzaではどちらでも対応するとしている。

TorrenzaとFusionの違い

TorrenzaとFusionの違い。基本的にCPU外にあるのがTorrenza、CPU内にあるのがFusionと考えれば分かりやすい

一方のFusionは、CPUパッケージ内部にアクセラレーターを実装してしまうものだ。アプローチとしては2種類が想定されていて、CPUとは別ダイのアクセラレーターを作り、両者を1パッケージ収めるマルチチップモジュール方式や、CPUと同じダイ上にアクセラレーター機能を実装するシリコンレベルでの統合方式があるという。

2006年に発表された時点では、まだ対応するアクセラレーター製品のなかったTorrenzaであるが、現在ではHTXスロット装着型とCPUソケット装着型の製品が各社から登場しているという。HTXスロット用のアクセラレーターカードでは、XMLアクセラレーターや浮動小数点演算カード、高速ネットワークカードなどが、CPUソケット型にはOpteron用ソケット(Socket 940)に装着可能なFPGA(プログラマブルな演算装置)が製品化されているという。

この他にリッチ氏は、AMDのクアッドコアCPUに向けた取り組みについても語った。特にアップデートされた点はなかったが、Opteronについては現在存在するSocket 940とSocket F(1207ピン)の並立状態を2008年までは継続する。ソケット形状だけでなくTDPの制限も現行CPUと同じ枠を維持することで、CPU単体の更新によるシステムアップグレードを可能にし、ユーザーは低い投資額での性能向上を得られるという。

Opteronのソケットと対応CPUのロードマップ

Opteronのソケットと対応CPUのロードマップ。2003年に登場したSocket 940は、2008年のCPUまで対応し続ける

“Barcelona”のダイ写真とブロックダイアグラム

“Barcelona”のダイ写真とブロックダイアグラム。4つのCPUコアを1つのダイ上に実装。共有型3次キャッシュも搭載する

また、2007年中盤に登場予定のクアッドコアCPU“Barcelona”(バルセロナ)についても言及された。現在のOpteronと同じソケット、同じTDPを維持し、“プラグイン”でのアップグレードが可能である点。SSE演算性能の強化などが説明されている。

HTX対応アクセラレーターカードの実演も

RCHTXを搭載したワークステーション

RCHTXを搭載したワークステーションによるデモも披露された

写真中央のカードがRCHTX

写真中央のカードがRCHTX。装着されているスロットは、PCI ExperssではなくHTXスロット

説明会の後半部では、日本セロックシカ(株)のHTX対応アクセラレーターカード『RCHTX-XV4』による、アクセラレーションの実演が披露された。RCHTXは米ザイリンクス社のFPGA、Virtex4シリーズを2チップ搭載した“高性能計算アクセラレーションカード”と銘打たれた製品である。主な用途は金融分析、資源探査、医療用画像処理、生命科学研究といった高度かつ大量の計算を要求する用途とされている。カードはHTXスロットに接続され、インターフェースは3.2GB/秒のデータ転送レートを持つ。またカード上にDVI出力とGigabit Ethernetポート×2を備える。

同社代表取締役のスティーブ・チャッペル(Steve Chappel)氏は、ハードウェアによるアクセラレーターの可能性について、実行性能の高速化だけでなく、CPUにとって重く、ボトルネックになる処理を代行することにより、CPUリソースを他の用途に振り向けられるという利点を挙げた。またカスタムチップではなく汎用性のあるFPGAを使う点については、ソフトウェア面での柔軟性を大きな利点として挙げている。

デモでは、金融分析計算とレーダーによる海底資源探査の分析を、CPUのみで実行した場合と、RCHTXで行なった場合の2種類が披露された。資源探査分析のデモでは、CPUのみの場合と比べて、計算結果を画像化して表示する際のフレームレートが格段に高く、高速な計算を実現していることが示された。

海底資源探査の分析計算デモ

海底資源探査の分析計算デモ。写真では分からないが、中央左がCPUのみ、同右がRCHTXによる計算の画像化で、右の方は滑らかに画像がアニメーションするが、左はカクカクであった

Torrenzaが主なターゲットするプラットフォームは、Opteronを搭載するサーバーシステムやワークステーションである。一方でFusionではグラフィックスチップの機能を取り込むことが計画されており、将来は一般消費者が手にするパソコン用CPUの分野でも、アクセラレーターを内蔵したCPUが普及してくることが期待されている。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン