このページの本文へ

導入前にストレージの節約度合いを調べてみよう

シマンテック、バックアップの重複排除効率を無料調査

2009年06月18日 09時30分更新

文● 金子拓郎/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

シマンテックは6月17日、都内の赤坂本社で「データ重複排除無償アセスメントプログラム」に関する記者発表会を行なった。このプログラムは、同社のバックアップソフトウェア「Veritas NetBackup PureDisk」が搭載する重複排除機能を自社に入れた場合、どの程度の効果が出るのかを無料で診断するというものだ。

重複排除について説明を行なうシマンテックのプロダクトSE部シニアシステムエンジニアの上雄記氏

 発表会での解説によると、データセンターにおける主要な課題の1つが、ストレージ容量の増加を抑制することだという。これは一般企業においても同様だろう。業務用データやメールのアーカイブ、さらにクライアントPCのバックアップデータなど、ストレージに保存するデータの量は増えるばかりだ。

 こうした問題を緩和する手段の1つが重複排除(DeDedupe)だ。ストレージに保存されたデータは、内容が重複していることが多い。たとえば、複数のクライアントPCのバックアップデータであれば、OSのシステムファイルの大半は同じ内容だ。重複排除は、これら同じ内容のデータをブロック単位で検出し、重複部分を削除する機能である。最近では、シマンテックに限らず、多くのエンタープライズ向けのバックアップソフトウェアやストレージ製品がこの機能を搭載している。

重複排除とは?

重複排除の複数の方式

 ただし、重複排除には複数の方式があり、製品によって搭載する方式が異なっている。この日の説明会の解説では、3通りの方式が紹介された。1つ目は「ホストプロセス型」で、データをストレージに格納してからストレージ内で重複排除処理を行なう方法だ。クライアントから送信されたデータは、すぐにストレージに保存されるため、転送速度は速い。ただし、格納後の重複排除の処理に時間がかかるデメリットがある。

重複排除の方式

 2つ目は「インライン型」で、ストレージのコントローラで重複排除を行なってから、ストレージに格納する方式だ。重複排除処理に時間がかかるとストレージへの格納が遅れるため、コントローラのパフォーマンスによっては転送速度が低下する可能性がある。

 そして、3つ目は「クライアント型」で、PureDiskが採用する方式だ。これは、クライアントPCにエージェントをインストールし、そこで重複排除をしてしまう。

PureDiskが採用するクライアント型の仕組み

 この方式では、重複するデータをネットワークに流さないため、ストレージ容量に加えて帯域の節約も実現する。

クライアント型の重複排除によって、帯域とストレージの節約が実現する

重複排除の効率を無料調査

 このようにストレージの容量や帯域を節約できるPureDiskの重複排除だが、導入にあたっては1つ問題がある。それは、具体的どの程度の節約になるかわかりにくいことだ。この日の発表資料では、ストレージ容量を最大98%削減、ネットワーク帯域を最大99.8%まで削減できるとしているが、あくまでも参考値に過ぎない。バックアップの対象となるPCの台数や用途、ネットワーク構成などによって結果は大きく異なってくるためだ。

 そこで活躍するのが、このたびの記者発表会のテーマであるデータ重複排除無償アセスメントプログラムだ。これは、Windowsのコマンドライン上で動く測定コマンドを使ってデータの更新率を測定する「簡易アセスメント」、PureDiskがインストールされたサーバを実際に導入する「物理アセスメント」、そしてPureDiskの実行環境の仮想マシンを使う「仮想アプライアンス」がある。

無料アセスメントの方式

 簡易アセスメントは重複排除の推定比率しか測定できないが、物理アセスメントと仮想アプライアンスでは、実際に5日間運用して転送速度や重複排除率をレポートすることが可能だ。

■関連サイト

カテゴリートップへ