このページの本文へ

前へ 1 2 次へ

【ISSCC 2005 Vol.6】“低消費電力でハイパフォーマンス”がキーワードとなったこれからのプロセッサー――ISSCC 2005セッションレポート

2005年02月14日 19時52分更新

文● 西川善司(トライゼット)

  • この記事をはてなブックマークに追加
  • 本文印刷
ISSCC 2005が開かれたサンフランシスコ、Marriott Hotelの会場の様子
ISSCC 2005が開かれたサンフランシスコ、Marriott Hotelの会場の様子

Cellプロセッサーに注目が集まった“ISSCC 2005(International Solid-State Circuits Conference 2005)”であったが、Cellプロセッサー以外にも多くのプロセッサー関連の発表が行なわれた。本稿では近年の大きなトピックと言える、“低消費電力とパフォーマンス”に注目したプロセッサーに関する講演について短くまとめた。

三洋電機、わずか81MHzで720pの映像を
リアルタイムエンコードするプロセッサーを発表

三洋電機(株)は“An 81MHz 1280×720Pi×els×30f/s MPEG-4 Video/Audio CODEC Processor”と題したセッションで、720p解像度(1280×720ドット)の映像をリアルタイムにMPEG-4/ASP(Advanced Simple Profile)へエンコードするプロセッサーのプロトタイプを発表した。このプロセッサーは本格的なAV機器向けというよりは、組み込み機器などの小規模なシステムへの搭載を前提に開発されており、画質と省電力性能のバランスを最重要視しているのが特徴だ。

三洋電機が発表したプロトタイプチップのダイ写真
三洋電機が発表したプロトタイプチップのダイ写真

最も画質とパフォーマンスに影響する“動き予測処理”は、演算ブロックを並列化することで対処。極力メモリーへのアクセスを減らして低クロック動作でも高効率なスループットが得られるようにした。その結果、プロトタイプチップでは720p解像度の映像のリアルタイムMPEG-4エンコード処理を、わずか81MHzのクロック周波数で達成した。

リアルタイムMPEG-4エンコーダーのブロック図 並列化された動き予測処理演算器のブロック図
リアルタイムMPEG-4エンコーダーのブロック図並列化された動き予測処理演算器のブロック図

プロトタイプチップは0.13μm、6層CMOSプロセスで製造された。トランジスター数は39万トランジスターで、80kbitのSRAMも内蔵する。81MHz動作で720pの映像エンコードを行なった際のトータル消費電力は、わずか480mW(1.3V駆動)だという。

三洋製品といえば“Xacti(ザクティ)”シリーズのような小型動画カメラが思い浮かぶが、このプロセッサーを使うことで小型動画カメラがハイビジョン対応する日もそう遠くはないかもしれない。

プロトタイプチップのスペック表。このクラスのチップとしては圧縮率対画質クオリティーに優れるB-VOP(フレーム双方向予測符号化)に対応しているのも特徴のひとつ
プロトタイプチップのスペック表。このクラスのチップとしては圧縮率対画質クオリティーに優れるB-VOP(フレーム双方向予測符号化)に対応しているのも特徴のひとつ

IBMのスーパーコンピューター“BlueGene/L”の秘密

BlueGene/Lのシステム階層概念図
BlueGene/Lのシステム階層概念図

米IBM社が開発したスーパーコンピューター“BlueGene/L”は、日本電気(株)の“地球シミュレータ”を抜き、現在演算性能では世界の頂点に立っている。その性能は70.72TFLOPSにもおよび、地球シミュレータの2倍の演算性能を誇っている。ちなみにCellプロセッサーは4GHz駆動で0.256TFLOPSだ。ISSCCではこのBlueGene/Lを構成するプロセッサーについてのセッション、“Creating the BlueGene/L Supercomputer from Low-Power SoC ASICs”も開催された。

BlueGene/Lのアーキテクチャーは、最高性能のプロセッサーで構成する従来のスーパーコンピュータとは異なり、ローコストで低消費電力のプロセッサーを高集積することで、最高性能を目指すというスタイルになっている。BlueGene/Lを構成する最小単位のCPUコアは、組み込み機器向けCPUである“PowerPC 440”がベースとなっている。PowerPC 440コアを選択したのは、もともと組み込み機器向けにデザインされたCPUだけあって、省電力性能に優れているためだ。しかしPowerPC 440自体はベクトル演算性能に長けているとは言い難く、BlueGene/Lではこれにデュアルパイプラインの浮動小数点演算器を付加して、コア2基を対称型に1チップにまとめたものを1CPUとしている。0.13μm世代のCMOSプロセスで製造され、ロジック規模は9500万トランジスター、ダイサイズは123mm2となっている。

BlueGene/LのCPUの基本スペック
BlueGene/LのCPUの基本スペック
BlueGene/LのCPUのブロックダイアグラム。2基のPowerPC 440コアにそれぞれFPUが付加されている BlueGene/L CPUのダイ写真。PU0とPU1がPowerPC 440コア。FPU0とFPU1はそれぞれ、PU0とPU1に付加されたFPU
BlueGene/LのCPUのブロックダイアグラム。2基のPowerPC 440コアにそれぞれFPUが付加されているBlueGene/L CPUのダイ写真。PU0とPU1がPowerPC 440コア。FPU0とFPU1はそれぞれ、PU0とPU1に付加されたFPU

駆動電圧は1.6V、動作クロック周波数は700MHz。1サイクル当たり2FLOPSの性能を持つので、1チップ当たりの性能は“2FLOPS×2FPU(デュアルFPU)×2コア×700MHz=5.6GFLOPS”となる。実際のBlueGene/Lでは、CPUを2基搭載したコンピューターカードを基礎として、カード16枚を搭載したものを1ノードカード、1ラック当たりで32ノードカード分搭載している(前掲のシステム階層概念図を参照)。米国ミネソタ州ローチェスターにあるIBMの施設に置かれた試作機は、16ラックシステムなので理論値では89.6TFLOPSの性能になる。ちなみに前出の70.72TFLOPSと言う値は、スーパーコンピューター用の標準ベンチマークソフト“Linpack”によって計測された。

1ノード当たりの消費電力は約13W(メモリーの消費電力は含まず)で、ミネソタ州の16ラックシステム全体の消費電力は約400kWとのこと。演算性能に対する消費電力としては、これまでのスーパーコンピューターと比較して大幅に小さいということだ。

前へ 1 2 次へ

注目ニュース

ASCII倶楽部

最新記事

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン