【最新パーツ性能チェック Vol.41】論理8CPUマシンがすぐできる! 新CPU「Dempsey」と次世代メモリ「FB-DIMM」のパワーはいかに?
2006年06月19日 00時00分更新
2つのCPUがそれぞれにメモリを持ち、両者が高速なHyperTransportバスで通信するという効率的なシステム構成で高い性能を実現し、サーバ・ワークステーション界でじわじわとシェアを広げてきたOpteron。昨年4月にはインテルに先駆けてデュアルコア版を投入したことで、その勢いには拍車がかかった。
対するインテルは昨年10月にようやくデュアルコアXeonを投入。ラインナップはボトムラインの2.8GHzのみのまま半年が経過したが、ようやく本命の新プラットフォーム“Bensley”が姿を現した。
Pentium Pro以来のバス分離と新種メモリの登場
インテルは今年前半に、「コードネーム“Bensley”プラットフォームで、デュアルCPUサーバのシステムに抜本的な改革を行なう」と表明していたが、それがいよいよ登場したわけだ。
主な特徴は、
1 2つの独立したFSBを持つチップセット
2 CPUは“Dempsey”、のちに“Woodcrest”
3 FB-DIMMメモリ
である。
インテルのデュアルCPUサーバのプラットフォームは、Pentium Pro以来ずっと1つのFSBを2つのCPUがシェアするデザインを用いてきた。これは、両CPUがフルにFSB性能を使おうとする際には競合になり、システムの性能低下を招く。そのような局面が無視できるほど小さければいいが、デュアルコアともなれば1つのFSBを4つのCPUコアが取り合うことになり、さすがに競合が無視できなくなりそうだ。“Bensley”のチップセット、コードネーム“Blackford”こと「5000」シリーズでは、2つのCPUに個別にFSBを用意することでついにこの問題をクリアした。すでに4CPU向けのチップセット、“TwinCastle”こと「E8500」ではデュアルFSBを実装しているが、これを追う形だ。しかもFSBは従来の800MHzから1066MHzに引き上げられた。
この新チップセットに合わせて、CPUには65nmプロセスのデュアルコアXeon、コードネーム“Dempsey”ことXeon 5000シリーズが登場した。このCPUは、内容的にはPentium XE(900番台)に相当するもので、2MBキャッシュの“Prescott”コアのダイが2つ、パッケージ内で接続されている(Preslerコア)。クロックは最高3.73GHz版で、シングルコア時代の最高クロックである3.8GHzにほぼ並んだ。シングルスレッド時の性能を犠牲にせずに、デュアルコアのメリットを享受できることになる。
“Dempsey”こと「Xeon 5000」シリーズ。これはエンジニアリングサンプルの「Xeon 5060」(3.2GHz)。見た目はデスクトップのPentium 4シリーズとまったく同じだ | 「Xeon 5000」の裏側。これもPentium 4そっくりだが、よく見ると切り欠きと端っこの間と、4つ端子がない。これによりLGA771となる。“Woodcrest”も同じ配置だ |
“Dempsey”のCPUソケット。大きさや装着方法は、おなじみのLGA775タイプのPentium 4と同じ | 「Xeon 5060」×2のシステム上でCPU情報を表示させたところ。2(デュアルCPU)×2(デュアルコア)×HT(2)=8で、計8つのCPUと認識されている |
FB-DIMMとは何か? その性能は?
1と2は重要ではあり、性能向上に直結はしているものの、斬新さ、画期的という点ではそれほど目を引くものではない。それよりも注目されるのは、今回から新たにサーバ用の新メモリとして採用される「FB-DIMM」である。
FB-DIMMはすでに秋葉原でも若干は流通しており実物も目にすることができるが、写真のようにDIMMモジュールの中央になにやらいかめしいチップが載っているのが特徴だ。このチップは“AMB”(Advanced Memory Buffer)といい、DIMM上に乗っているメモリ(普通のDDR2メモリ)とチップセットの間に入り、データの受け渡しを行なう役割を持つ。また、1つのチャネルに複数のFB-DIMMが装着された場合には、メモリに読み書きされるデータは、“AMB”を順番に伝わって目的地(メモリやチップセット)に渡される。
通信が1対1で行なわれるため、普通のDDR2のようなバス上に複数のスロットがあるような環境では実現できない高クロックでの通信が行なえる。
FB-DIMMにおいては、上りと下りの信号線が分離されていて、上り(チップセットからメモリ方向)が14bit、下りが10bitとなっている。一方クロックのほうは、載っているメモリそのものの周波数(DDR2-533であれば533MHz)の6倍に固定されている。したがって、DDR2-533(PC-4200)であれば、533×6=3.2GHz動作となる。であれば上りの場合、転送能力は3.2(GHz)×14(bit)÷9(ECC付きメモリ、バイト換算)=5GB/秒、PC5000相当ということになりそうだが、残念ながらそうではない。
MicronのFB-DIMMモジュールのデータシートによれば、FB-DIMMではデータを「フレーム」という単位で管理していて、上り方向の場合、転送できるデータは1フレームにつき144bit(18バイト)で、これはDDR2における1コマンドクロックにおけるデータ転送能力にちょうどつりあう、という。
DDRタイプのメモリでは1コマンドクロックで2回の転送を行なえるから、ECCつき72bitのDIMMでは確かに144bitの転送が行なえる。この能力がFB-DIMMとマッチするということは、FB-DIMMは1コマンドクロック=2転送クロック=12FB-DIMMクロックで144bitを転送できるということになる。14bitの信号線で12クロックかければ164bit送れるはずなので、うち20bitは制御用なり予約なりで使えないということだろう。いずれにしても、DDR2-533のメモリを使っていれば、DDR2だろうとFB-DIMMだろうとデータ転送能力は4.26GB/秒、つまりどちらもPC4200ということになるし、DDR2-666を使う場合にはFB-DIMMのクロックは666×6=4GHzにアップし、能力はともにPC5300相当ということになる。
一方下りについては、信号線が少ない(10bit)うえにコマンドなども乗せなければならないためか、1フレームにつき9バイトしか転送できないという。能力としては上りの半分だ。言い換えれば、書き込みについては普通のDDR2モジュールを使う場合の半分の能力になる。
ただ、FB-DIMMでは上りと下りが分離されているから、上りのデータを送りながら書き込む(下りの)データを取り込むこともできるため、この速度差は相当隠蔽されるだろう。メモリモジュールとして見た場合には、たとえばPC4200タイプのFB-DIMMの場合、上り4.26GB/秒、下り2.13GB/秒の計6.4GB/秒ということもでき、上り(読み出し)データのほうが多い環境を想定すればむしろDDR2より性能が上がる可能性もある。
Supermicro社のDempseyマザー「X7DA8」のメモリスロット。よく見ると、DIMM1~DIMM4まであり、それぞれA/Bがある。4チャンネルに対し、各2つづつDIMMを装着できるようになっていることがわかる。今回は各チャネルに1GBずつ、PC-4200のFB-DIMMを計4枚装着した |
FB-DIMMモジュール。中央のヒートシンクのついたチップが、チップセット、およびDIMM間で通信を行なう「AMB」。DIMM上のDDR2メモリに対し、実際に読み書きを行なうのもこのチップだ |