アウトオブオーダーにマルチコア対応
Cortex-A9
Cortex-A8に続き、2007年に発表されたのがCortex-A9である。インオーダーのままではどうしてもさらなるIPC(Instructions Per Cycle)向上は難しいと判断したのか、ARMもここでついにアウトオブオーダーを投入する。
Cortex-A8の性能は、ARMの公表値で2.0 DMIPS/MHzなのに対して、Cortex-A9では2.5 DMIPS/MHzまで改善しているのは、このアウトオブオーダーの搭載によるところが大きい。ただし、命令のデコードそのものは2命令/サイクルと、Cortex-A8と同じままだ。要するに、より効率よく「スケジュール→実行→ライトバック」の過程をこなせるようになった、ということである。
Cortex-A9はまた、当初からマルチプロセッサーに対応しており、最大4コアまでをサポートする。製造プロセスは当初65nmで、45nmあたりまで対応することを想定していた。ただ予想外だったのは、32nmプロセスが台湾TSMCといった主要ファウンドリにスキップされてしまい、45~40nmプロセスがARMの想定以上に長く利用されたことだ。
ARMとしては、65~45nm世代をCortex-A9で、続く32nm世代以降はCortex-A15に切り替える予定だったようだが、この目算が狂ったわけだ。Cortex-A9を使う顧客としても、当初は想定しなかった40nm世代を32nmの代わりに長く使うことを余儀なくされており、ここにCortex-A9より複雑でダイサイズが大きいCortex-A15を持ってくるのは、望まなかったということだろう。
しかし、40nm世代の後継となる28nmプロセスの立ち上がりも、決して良好ではない。今のところTSMCに関しては、歩留まりの問題は一応解決したが、大手メーカーが殺到している関係で生産量が全然追いつかず、他方でサムスンやGLOBALFOUNDRIES、UMCなどのファウンドリは、まだ歩留まりの問題を解決しきれていない。その結果、28nmプロセスに関しても「当面は使い慣れたCortex-A9を使いたい」という顧客からの要望がかなり多かったようで、28nmプロセスにもCortex-A9が引き続き提供されることになっている。Cortex-A9はCortex-A8をはるかに超える、幅広いプロセスに対応して使われることになるわけだ。
ARM11後継のローエンド
Cortex-A5
Cortex-A9は性能を改善する方向に進化したが、逆に「もっと性能は低くていいから、低コスト・低消費電力のコアがほしい」というニーズも当然ある。PC市場の場合、例えばCore iベースのコアの動作周波数を落とし、機能も削減してCeleronやPentiumブランドで売るという方策がよく取られる。だがこれは、少品種大量生産を前提にするから作り変えるよりも安いという話だ。IPの形で購入した回路をSoCに組み込むという前提であれば、例えばCortex-A9を300MHzで動かすよりも、Cortex-A8やそれ以前の「ARM11」コアを、400~600MHzで動かすほうが、ダイサイズが小さくなる分安いし消費電力も低い。
「Cortex-A5」はCortex-A8の下というよりも、ARM11の代替といったポジションを狙ったもので、設計目標として以下のような点が掲げられていた。
- ARM11と比較して20%高いDMIPS/MHz値
- ARM11と比べて、同一プロセスで33%少ないダイサイズ
- ARM11と比べて80%高いDMIPS/mW値
ARM11と同クラスの性能でかまわないのなら、スーパースカラーやアウトオブオーダーは不要ということで、パイプラインはシンプルな8段構成となっている。ターゲットは40nmプロセスと28nmプロセスだが、恐らくは20nmプロセスでも、Cortex-A5コアが利用されるケースが出てくるだろうと想像される。ちなみに、絶対性能としてのCortex-A5は1.57 DMIPS/MHz程度とされており、ARM11の1.25 DMIPS/MHzよりはだいぶ改善しているが、Cortex-A8/A9には追いつかない程度である。
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ