このページの本文へ

【最新パーツ性能チェック Vol.41】論理8CPUマシンがすぐできる! 新CPU「Dempsey」と次世代メモリ「FB-DIMM」のパワーはいかに?

2006年06月19日 00時00分更新

文● 月刊アスキー編集部 野口岳郎

  • この記事をはてなブックマークに追加
  • 本文印刷

FB-DIMMのメリットとデメリットは?

 インテルが今回からサーバにFB-DIMMを投入する理由は、メモリの容量と速度の両方の限界を打ち破るためである。
 従来サーバ用メモリにはレジスタードDIMMが用いられてきた。これは、通常全メモリチップが直接受け取るコマンド・アドレスデータを、一度DIMM上のバッファチップが受け取るようにすることで、チップセットへの電気的な負荷を軽減し、その分多くのDIMMを扱えるようにするものだ。ただ、データについては通常のアンバッファードDIMMの環境と同様、1つのバス上に複数のDIMMが乗る構造なのでノイズが乗りやすい。結果、大量のメモリを乗せられはするものの、クロックは制限される。たとえばインテルの「E7520」の場合、4スロットまでの構成が見られはするものの、クロックはDDR2-400止まりである。
 FB-DIMMでは、規格上1チャネルにつき最大8つまでDIMMを搭載可能だ。というのも、通信自体はチップセットと一番手前のDIMMが通信し、次にそのDIMMがその後ろのDIMMと通信……という形で情報が伝達されるため、数が増えても信号が劣化することはないためだ。ただ、このように順繰りにデータが転送されるため、一番うしろのDIMMでは受け取るまでに時間がかかってしまうこともあってか、規格上は1チャネルに最大8つまでとなっている。この、データが届くまでの時間の遅れ(レイテンシ)はFB-DIMMの最大の弱点とされている。
 もっとも、レイテンシが増えるといっても、データ転送レート自体には変化はない。一番奥のメモリであっても、PC5300であれば5.3GB/秒の能力が出せる。クロックに制約が加わるDDRより、スループット面ではすでに有利である。
 FB-DIMMのもうひとつのメリットは、少数の高速な信号線を使うことによる必要配線数の削減だ。DDRであれば1チャネルにつき240本の線が必要だが、FB-DIMMは70本ほどですむという。
 マルチCPUサーバの場合、多数のCPUからのメモリアクセスに応えるために、チップセットは高性能なメモリコントローラを内蔵したい。しかしメモリのクロックには規格上の限度があり、しかもそうほいほいとは高速化できない。マルチコア時代を見据えたさらなる性能向上のためには、チャネル数を増やすことで対応したいが、DDR2の場合、チップセットには1チャネルにつき130ほど端子が必要になるし、基板上は最大240の信号線を配置する必要がある。現在ではデュアルチャネルDDRがポピュラーだが、たとえばこれを4チャンネルにするというのはチップセットのピン数、基板配線の両面から困難が伴う。
 その点FB-DIMMは、1チャネルあたり70本ほどの信号線ですむという。そのため、デュアルチャネルDDRの480本の信号線が許容できるなら、FB-DIMMなら6チャンネル設けてもまだ余裕だ。性能的には3倍にできる計算だ。
 また、チャネル数が多いうえに1チャネルあたりの装着可能DIMM数が多いことで、システムとしての総搭載メモリ量は大きく増える。6チャネルあれば48個のDIMMをハンドリングできるわけで、2チャンネル、各4DIMMのDDRに比べ、6倍のメモリを搭載可能になる。800MHz動作を前提にするなら、レジスタードDIMMは1チャネルあたり2DIMMが限界だが、FB-DIMMなら数を減らす必要はないので12倍ということになる。CPUの64bit化が進む中、大容量メモリを搭載できることのメリットは大きい。
 なお、Bensleyプラットフォームのチップセット“5000P/5000X”は4チャンネルのFB-DIMMインターフェイスを設け、PC5300 FB-DIMMまでサポート、各チャネルには最大4本までのDIMMが搭載可能(したがって計16DIMM)、メモリ最大容量は64GBとなっている。

思ったほど大きくないレイテンシ、思ったほど早くないスループット

 さて、4チャンネルのFB-DIMMによって、メモリ性能はどこまで上がっただろうか。また、気になるレイテンシはどれくらい増えるのだろうか? 計測した結果がグラフ1である。
 「Sandra 2005」で計測した転送能力は3.5GB/秒程度で、理論性能(約17GB/秒)にははるか遠い結果となった。「Irwindale」でも3.9GB/秒出ている。「Sandra 2007」では結果が計測するたびにばらつき、最大4.3GB/秒まで出ることがあったが、これでも理論値に比べるとかなり低い。ただ、メモリ性能の測定はアルゴリズムによって大きく変わるし、FB-DIMMの場合にはレイテンシが響いているぶんもあると考えられるので一概に低いとは言えないだろう。
 レイテンシについては、「Everest」、「Sandra 2007」ともに、「Irwindale」より若干大きく(=遅く)なっている。ランダムアクセス時の数値は6%程度の差で目くじらを立てるほどではないが、リニアアクセス時では「Irwindale」(普通のDDR2)のほうが37%高速となっている。リニアアクセス時には、メモリそのもののページオープン・クローズといったウェイトがほとんどないため、14ビットの「フレーム」に分割・統合するオーバーヘッドが割合として大きく効いてくるのがわかる。また今回は1つのチャネルに1つしかFB-DIMMがない、レイテンシ的には一番理想的な状態だった。複数のDIMMが刺さった場合には、平均レイテンシはさらに延びることになる。
 メモリアクセスがランダムに近ければ影響はあまりなく、リニアに近い場合にはそれなりに影響が出そうだ。これはアプリケーションによっても異なるだろうから、実際にベンチマークを取ってみないと判断できない。

グラフ1、2 FB-DIMMの性能を計測した結果。レイテンシは「Irwindale」に比べ、数nsは増えている。リニアアクセス時には割合としては無視できない。スループットに関しては残念ながら今回使ったテストでは芳しい結果が得られなかった

カテゴリートップへ

注目ニュース

ASCII倶楽部

ASCII.jpメール アキバマガジン

クルマ情報byASCII

ピックアップ