7月に入ってからインテルによるOpteron追撃がすさまじい。1日に、それまで最高1.9GHzまでだったXeon MP(最大4CPU構成までが可能。Xeonは2CPUまで)のラインアップを一気に2.8GHzまで引き上げ、4CPUのハイエンドサーバーを狙うOpteron 800シリーズを牽制したかと思えば、その2週間後の15日には、すでに3.06GHzに達しているXeonに、これまでXeon MPの専売特許だった3次キャッシュ搭載版を“3.06GHz”としてリリースしてきた。デュアル用のOpteron 200シリーズと激戦を展開中のXeon 3.06GHzに、掟破りの援軍というわけだ。では、3次キャッシュの効果とはどれほどのものなのだろうか。今回は日本コンピューティングシステム(JCS)がリリースしたデュアルXeonシステムを借用して、性能をレポートする。
日本コンピューティングシステム(JCS)『Vintage VC83060-GLDP』 |
●日本コンピューティングシステム(JCS)
●Vintage VC83060-GLDP
●価格 72万1000円
●http://www.jcsn.co.jp/
●サーバーからスーパーコンピューターまで手がけるJCSのXeonワークステーション。今回借用したこのシステムはデュアルXeon-3.06GHz、GeForce FX5900、Ultra 320SCSIに1万回転、72GBのSCSI HDDという絢爛豪華なシステム。構成は同社サイトで変更できる。
●本体側面を開いたところ。実際にはヒートシンクを覆う形で黒いファンが装着されている。マザーボードはインテルの『Server Board SE7505VB2』。E7505チップセットベースで、AGPとPCI-Xスロットを2本備える。メモリーはレジスタードPC2100を最大8GBまで搭載可能。本体前面はホットスワップ可能なSCSIドライブベイになっている。 |
3次キャッシュとは何か
3次キャッシュという言葉は魅惑に満ちている。世界最速を競うサーバ用CPUは、しばしば3次キャッシュをチップ内、CPUパッケージ内、あるいはマザーボード上に装備している。パワーユーザーなら、3次キャッシュを備えたマシンを使いたい、作りたいと思ったことが一度はあるのではないだろうか。
3次キャッシュとは、1次キャッシュにヒットせず、2次キャッシュにもヒットしなかった場合にCPUがデータを探しに行く場所である。3次キャッシュがない普通のXeonやPentium4だと、2次キャッシュになければ低速なメインメモリを読みに行くしかないが、Xeon-3.06GHzではそこで3次キャッシュという、もう一段のバックアップがあるわけだ。速度的には1次キャッシュが一番速く、2次、3次となるにしたがって待ち時間が大きくなっていくが、Xeonの場合は3次キャッシュとはいえオンチップであり、メインメモリを読むよりははるかに高速である。
1MBキャッシュ搭載でダイは大きいはずだが、ヒートスプレッダーで覆われていて残念ながら見ることはできない。キャパシターなどの数と配置は2.8GHz版と同じだ。 |
さて、3次キャッシュが1MBというと、2次キャッシュに入りきらなかったデータをさらに1MB分バックアップしてくれるように錯覚しそうだが、そうではない。これは1次キャッシュや2次キャッシュと同様、「メインメモリの中でこれまでに最もよく使われた1MB」分を保存するものだ。
お気づきのように、最もよく使われる512KB分は2次キャッシュに入っている。それらのデータを再参照する場合には、当然高速な2次キャッシュ相手になされる。つまり、1MBの3次キャッシュの内容のうち、2次キャッシュとかぶっている512KB分は、CPUコアからアクセスされることはない。3次キャッシュがアクセスされる(=3次キャッシュによる効果が現われる)のは、2次キャッシュには入っていない、利用頻度が低い残りの512KBのデータが必要な場合である。
3次キャッシュという言葉を使うと正体が見えにくくなる。むしろ、「Xeonの2次キャッシュが1MBになった。しかし、その増えた分の512KB分はアクセス速度が遅い」と考えるほうが、実態をイメージしやすい。
これはどれほどの性能インパクトだろうか。Pentium 4はWillametteからNorthwoodコアに移行する際、2次キャッシュを倍増させたし、Athlon XPも3000+登場時にキャッシュを倍増させている。Pentium 4のときの例で見ると、キャッシュ倍増によってSysmark 2001の性能は5~6%上がっている。今回は「倍増はしたが、増えた部分のスピードは遅い」ので、4%前後というのが目安になるだろう。
長くなったが、正体を見極めたところで、実際に性能測定に移ろう。
メモリ性能は確かに向上
青が3.06GHz、他はペン4など。どれも1MBで性能が最低になるのに対し、3.06GHzの粘りが際だつ。 |
右の図は、Sandra 2003で計測したブロックサイズ別アクセス速度だ。Pentium 4やXeonは、2次キャッシュの効果が切れる512KBで値が落ち、1MBではメインメモリと同等になるが、3.06GHzはここで毎秒6GBと、かなり踏みとどまっている。
キャッシュ内部にはベンチマークプログラム自体も入るため、データサイズが512KBや1MBといった、キャッシュサイズいっぱいの場合には、キャッシュに100%ヒットはしない(=性能が低めに出る)。Pentium4で、本来同じ速度になるはずの256KBと512KBで、512KBのほうが大きく値を落としているのはそのためだ。同様に、Xeonの1MB 3次キャッシュの能力は、このテストに出ている6GB/秒といわず、もう少し高く見てもいいはずである。ともあれ、メインメモリに比べればこれでも4倍の性能であり、3次キャッシュの効果が発揮されていることがわかる。