このページの本文へ

ロードマップでわかる!当世プロセッサー事情 第159回

スマホを制してWindows 8にも ARMプロセッサーの最新事情

2012年07月09日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

アウトオブオーダーにマルチコア対応
Cortex-A9

Cortex-A8以降のARMアーキテクチャーロードマップ

 Cortex-A8に続き、2007年に発表されたのがCortex-A9である。インオーダーのままではどうしてもさらなるIPC(Instructions Per Cycle)向上は難しいと判断したのか、ARMもここでついにアウトオブオーダーを投入する。

Cortex-A9の内部構造。実行ユニットはNEON/FPUを除くと5つに拡張された

 Cortex-A8の性能は、ARMの公表値で2.0 DMIPS/MHzなのに対して、Cortex-A9では2.5 DMIPS/MHzまで改善しているのは、このアウトオブオーダーの搭載によるところが大きい。ただし、命令のデコードそのものは2命令/サイクルと、Cortex-A8と同じままだ。要するに、より効率よく「スケジュール→実行→ライトバック」の過程をこなせるようになった、ということである。

 Cortex-A9はまた、当初からマルチプロセッサーに対応しており、最大4コアまでをサポートする。製造プロセスは当初65nmで、45nmあたりまで対応することを想定していた。ただ予想外だったのは、32nmプロセスが台湾TSMCといった主要ファウンドリにスキップされてしまい、45~40nmプロセスがARMの想定以上に長く利用されたことだ。

 ARMとしては、65~45nm世代をCortex-A9で、続く32nm世代以降はCortex-A15に切り替える予定だったようだが、この目算が狂ったわけだ。Cortex-A9を使う顧客としても、当初は想定しなかった40nm世代を32nmの代わりに長く使うことを余儀なくされており、ここにCortex-A9より複雑でダイサイズが大きいCortex-A15を持ってくるのは、望まなかったということだろう。

 しかし、40nm世代の後継となる28nmプロセスの立ち上がりも、決して良好ではない。今のところTSMCに関しては、歩留まりの問題は一応解決したが、大手メーカーが殺到している関係で生産量が全然追いつかず、他方でサムスンやGLOBALFOUNDRIES、UMCなどのファウンドリは、まだ歩留まりの問題を解決しきれていない。その結果、28nmプロセスに関しても「当面は使い慣れたCortex-A9を使いたい」という顧客からの要望がかなり多かったようで、28nmプロセスにもCortex-A9が引き続き提供されることになっている。Cortex-A9はCortex-A8をはるかに超える、幅広いプロセスに対応して使われることになるわけだ。

ARM11後継のローエンド
Cortex-A5

 Cortex-A9は性能を改善する方向に進化したが、逆に「もっと性能は低くていいから、低コスト・低消費電力のコアがほしい」というニーズも当然ある。PC市場の場合、例えばCore iベースのコアの動作周波数を落とし、機能も削減してCeleronやPentiumブランドで売るという方策がよく取られる。だがこれは、少品種大量生産を前提にするから作り変えるよりも安いという話だ。IPの形で購入した回路をSoCに組み込むという前提であれば、例えばCortex-A9を300MHzで動かすよりも、Cortex-A8やそれ以前の「ARM11」コアを、400~600MHzで動かすほうが、ダイサイズが小さくなる分安いし消費電力も低い。

 「Cortex-A5」はCortex-A8の下というよりも、ARM11の代替といったポジションを狙ったもので、設計目標として以下のような点が掲げられていた。

  • ARM11と比較して20%高いDMIPS/MHz値
  • ARM11と比べて、同一プロセスで33%少ないダイサイズ
  • ARM11と比べて80%高いDMIPS/mW値

Cortex-A5のパイプライン。シンプルなパイプライン構造で、ALUとAGUで実行ユニットは分離されているが、ALUとAGUが両方動作するような命令ならば両方動くし、そうでなければ片方だけが動く。FPUや32bit MACはオプション扱い

 ARM11と同クラスの性能でかまわないのなら、スーパースカラーやアウトオブオーダーは不要ということで、パイプラインはシンプルな8段構成となっている。ターゲットは40nmプロセスと28nmプロセスだが、恐らくは20nmプロセスでも、Cortex-A5コアが利用されるケースが出てくるだろうと想像される。ちなみに、絶対性能としてのCortex-A5は1.57 DMIPS/MHz程度とされており、ARM11の1.25 DMIPS/MHzよりはだいぶ改善しているが、Cortex-A8/A9には追いつかない程度である。

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン