Cortex-A7より上でCortex-A9より下?
Cortex-A53の性能は
一方Cortex-A53については、もう少し細かな数字が示されている。まず同程度の動作周波数を持つ「Cortex-A9 Dual Core」「Cortex-A7 Quad Core」「Cortex-A53 Quad Core」の3種類で、あるベンチマークテストを実行した結果が下のグラフである(関連リンクの「Performance」タブ参照)。
これで見ると、Cortex-A53は飛びぬけて性能が高いように見える。しかしCortex-A9がデュアルコアであることを勘案すると、単体性能で1番高速なのはCortex-A9であり、Cortex-A53の性能は、Cortex-A9とCortex-A7の間くらいであると想像される。
ちなみにCortex-A7は、「限定的な2命令同時実行」のインオーダーパイプライン構成である。限定的、というのは「どんな命令でも2命令同時に実行できるわけではない」という意味で、インテルの「Atom」と同じタイプと考えればいい。これに比べると、完全2命令同時実行のCortex-A53は、より高い性能を引き出せるはずだ。それでも2命令をアウトオブオーダーで実行できるCortex-A9ほどではないということで、この結果はリーズナブルな性能に思える。
それ以外のベンチマーク結果では、やはりARMのサイトに掲載されているもので、Cortex-A5/A7とA53を比較した数値がある。比較対象はなぜかA9ではない。
Cortex-A5 | Cortex-A7 | Cortex-A53 | |
---|---|---|---|
Dhrystone(DMIPS/MHz) | 1.6 | 1.9 | 2.3 |
CoreMark(CoreMark/MHz) | 2.3 | 2.6 | 3.0 |
SPECInt 2000 base | 290 | 350 | 450 |
これと同じベンチマークテストでCortex-A9の数字は、Dhrystoneの場合「2.5 DMIPS/MHz」と以前に発表されている。これと比較しても、Cortex-A53はCortex-A9よりやや遅い程度と推定される。ベンチマーク結果ではもうひとつ、主要なアプリケーションベンチマークの結果も示されている。こちらでもCortex-A53はCortex-A7よりは高速で、Cortex-A9と同程度という結果になっている。
big.LITTLE Processingを視野に入れて
シンプルな構成にしたCortex-A53
ARMはCortex-A57とCortex-A53で、「big.LITTLE Processing」構成を可能とするとしている。元はと言えば、これはCortex-A15とCortex-A7を組み合わせて搭載した環境の話で、負荷に応じて動作させるコアを動的に切り替えるという仕組みである。
例えばCortex-A15が2コアとCotex-A7が2コアという構成の場合、処理負荷が少なかったり待機中といったケースでは、Cortex-A15を完全にシャットダウンしてCortex-A7側を動かす。一方で処理負荷が高まってきたら、Cortex-A15に処理を引き継ぎ、Cortex-A7側をシャットダウンするという仕組みだ。従来のプロセッサーの省電力機構は、せいぜいが動作周波数を下げるとか不要なブロックをクロックゲーティングで止める程度だから、これに比べるとbig.LITTLE構成では、大幅に消費電力を下げることが可能になる。
その一方で、コアそのものの起動/シャットダウンには時間がかかるし、稼働中のプロセッサーの状態を、そのままもう片方のコアにコピーするのにもやはり時間がかかる。煩雑に負荷の状況が変わる状態でコアを切り替えたりすれば、オーバーヘッドが恐ろしく増えるケースも考えられる。また2種類のコアとそれぞれの2次キャッシュを搭載するため、ダイサイズが余分に大きくなることもデメリットとして考えられる。
実際にbig.LITTLEを採用するかはユーザーであるSoCベンダーの判断次第ではあるが、Cortex-A53の簡単な構造は、当然このbig.LITTLEを睨んだものである。つまり2次キャッシュはともかくコアそのものはなるべく小さく抑えることで、big.LITTLE採用時にダイサイズの肥大化を最小限に抑えるとともに、省電力動作時になるべく消費電力を抑える、ということが目的である。こう考えると、Cortex-A53の構成がCortex-A7+α程度のものであることの必然性が理解しやすい。
ARMはCortex-A57/A53をどんなアプリケーションに使おうとしているのか? それについては、次回にAMDのロードマップに絡めて説明したい。
この連載の記事
-
第768回
PC
AIアクセラレーター「Gaudi 3」の性能は前世代の2~4倍 インテル CPUロードマップ -
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 - この連載の一覧へ