3次キャッシュは排他ではない2MB
2MBの3次キャッシュが追加された、というと、一見、従来はキャッシュできなかったデータを新たに2MB分キャッシュできるようになる、とも思いたくなる。一部にはそのような報道もあるが、実際にはプラスされるのは1.5MB分である。というのは、3次キャッシュに最もよく参照された2MB分のデータが入り、2次キャッシュにはそのなかでも特によく参照された512KB分のデータが収納される、というアーキテクチャになっているからだ。
要するに、3次キャッシュの内容のうち512KB分は2次キャッシュとかぶっている。2MBの3次キャッシュによって「新たに」キャッシュ可能になるデータは差し引き1.5MB分となる。このことは、メモリーの読み出しサイズを2MB近辺で細かく調整してテストしてみるとわかる。Professionalhearts製メモリテストプログラムによれば、グラフ1のように、メモリ性能が2MBを超えるとがくんと落ちる。もし3次キャッシュが2次キャッシュにプラスされる形で入っている(つまり、計2.5MBまでキャッシュできる)とすれば、このような結果にはならない。
さて、グラフ2ではPentium 4-3.2GHzとキャッシュ性能の比較を行なってみた。3次キャッシュの効果は一目瞭然である。このテストでは、メインメモリ性能は4.6GB/秒であるのに対し、3次キャッシュで対応できる2MBまでの読み書きは約11GB/秒という速さになっている。2MBまでの領域のアクセスは非常に多いと思われるので、非常におおざっぱに言えば、この3次キャッシュの搭載で、多くのメモリアクセスが従来の2倍にスピードアップすると言えなくもない。とすれば、これはかなりの性能向上が期待できる。
Athlon 64-3200+は抜いたが、FX-51に関しては微妙
さて、いよいよP4EEのパフォーマンスである。代表的な例をいくつか挙げたが(グラフ3~6)、見てのとおり、勝ち負けはかなり錯綜する。ただ、ここに挙げた以外のテストの結果も総合すると、Athlon 64-3200+は抜いたが、Athlon 64FX-51とは対等か、わずかに劣勢、という程度だ。
前回(Vol.15)で、Athlon 64-3200+はPentium 4-3200+をわずかにオーバーし、Athlon 64FX-51は明白なリードを保ってトップ、と述べた。ワン・ツーをAthlon 64にさらわれた格好になっていたわけだが、P4EEの投入で、FX-51に対してP4EE、64-3200+に対してはPentium 4-3.2GHzをそれぞれ対抗製品として位置づけられるようになるわけで、P4EEが発売されれば、「独走態勢」には歯止めをかけられることになる。