性能よりも消費電力効率で
勝負したCrusoe
ここまでの話で気が付かれたかもしれないが、例えばALU命令に限ってみても、Crusoeは1サイクルあたり1回しか処理できない。つまり同じ動作周波数であれば、当時競合した「Mobile Pentium III」には、性能面で全然追いつかない。同程度の性能を出そうとすると、最低でも動作周波数を2倍にしないと釣り合わないし、パフォーマンスを測定すればこれが裏付けられた。
それにも関わらずCrusoeが登場当初に流行ったのは、消費電力効率という点では圧倒的に優れていたからだ。Crusoeの場合、プログラムの初回実行時には「CMS」(Code Morphing Software)が動作して、x86命令を内部のAtom命令に変換。それをキャッシュに格納した上で実行するので、どうしてもオーバーヘッドが大きい。
しかし一度変換したものを繰り返し利用する場合、非常にシンプルなCPUパイプラインが動作するので、複雑なパイプラインを動かすMobile Pentium IIIよりも、消費電力効率がはるかに高い。例えばDVD再生の場合、Mobile Pentium IIIが平均1.13Wを必要としたのに対して、Crusoeでは0.42Wで実現できるといった結果も出ている。
逆に言えば、Mobile Pentium IIIがCrusoe並みに消費電力を落とそうとすると、大幅に動作周波数を落とすか、強制的にスリープ状態にして平均消費電力を下げるしかなく、これでは性能が大幅に低下してしまう。つまりCrusoeは絶対的な性能ではなく、性能/消費電力比を高く保つことを狙ったアーキテクチャーであったわけだ。
トランスメタではもうひとつの利点として、CMSによってハードウェアが簡素化できるため、ダイサイズを小さく抑えられて、コスト低減に効果的というアピールもしていた。同社が発表した資料によれば、インテルCPUとのダイサイズの比較は以下のようになっている。
CPU | プロセス | 1次キャッシュ | 2次キャッシュ | ダイサイズ |
---|---|---|---|---|
Mobile Pentium II | 0.25μm | 32KB | 256KB | 180mm2 |
Mobile Pentium III | 0.18μm | 32KB | 256KB | 106mm2 |
TM3120 | 0.22μm | 96KB | - | 77mm2 |
TM5400 | 0.18μm | 128KB | 256KB | 73mm2 |
CMSによって変換したコードを格納するため、キャッシュサイズは大きめになるが、それを加味してもCPUコアがシンプルな分だけ、ダイサイズが削減できるというわけだ。
皮算用どうりにはいかなかったCrusoe
実際のCrusoeはトランスメタの思惑どおりになっただろうか? まずコストから見てみよう。たしかに、純粋にダイサイズだけを見れば、Crusoeが有利である。しかし半導体のコストは、ダイサイズだけで決まるものではない。半導体マスクのコストや設計費/検証費、パッケージングコストなども必要である。これらはダイサイズとは比例せず、出荷数量で決まってくる。そのため、CPUは多少ダイサイズが大きくても、大量に出荷できればコスト面で競合することは十分可能だし、事実そうなった。
次にVLIWによる効用も考えてみる。Crusoeほどに完璧に単純化すると、プロセッサーの構造はは恐ろしく簡単になる。その反面、性能へのペナルティーも大きい。58回でも取り上げたが、割り込み処理も全部CMS経由で処理する結果として、頻繁に割り込みがかかる処理では恐ろしく性能が低下した。例えばUSB 1.1/2.0のハンドリングなどその良い例だ。
また、例えばノートPCであっても、常に省電力である必要はない。持ち歩いて時々使うという場合には、省電力性が有難い。しかしデスクや自宅でACアダプターをつないでる場合には、そこまで省電力である必要はなく、むしろもう少し性能がほしい。こうした場合にCrusoeでは対応が難しい。
利点である低消費電力も、インテルがMobile Pentium IIIに超低電圧版を投入し始めてからは、劇的な差ではなくなってきた。そもそもノートPCの場合、一番電力を消費するのは液晶パネルのバックライトで、CPU同士を比較すると消費電力が大きく違ったとしても、システム全体としてはあまり違わないこともある。つまりCrusoeの低消費電力性は、エンドユーザーにとってはそれほど大きな価値にならないわけだ。
この連載の記事
-
第767回
PC
Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ -
第766回
デジタル
Instinct MI300のI/OダイはXCDとCCDのどちらにも搭載できる驚きの構造 AMD GPUロードマップ -
第765回
PC
GB200 Grace Blackwell SuperchipのTDPは1200W NVIDIA GPUロードマップ -
第764回
PC
B100は1ダイあたりの性能がH100を下回るがAI性能はH100の5倍 NVIDIA GPUロードマップ -
第763回
PC
FDD/HDDをつなぐため急速に普及したSASI 消え去ったI/F史 -
第762回
PC
測定器やFDDなどどんな機器も接続できたGPIB 消え去ったI/F史 -
第761回
PC
Intel 14Aの量産は2年遅れの2028年? 半導体生産2位を目指すインテル インテル CPUロードマップ -
第760回
PC
14nmを再構築したIntel 12が2027年に登場すればおもしろいことになりそう インテル CPUロードマップ -
第759回
PC
プリンター接続で業界標準になったセントロニクスI/F 消え去ったI/F史 -
第758回
PC
モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 -
第757回
PC
「RISC-VはArmに劣る」と主張し猛烈な批判にあうArm RISC-Vプロセッサー遍歴 - この連載の一覧へ