WAN回線の増強は不要!災害対策での需要も急増
Data Domainが実現するテープバックアップとの決別
2011年06月20日 09時00分更新
重複排除専用のストレージという新しいジャンルを作ったEMCの「Data Domain」。災害対策やDRという観点でも注目を集めるData Domainのストレージについて、EMCジャパン BRS事業本部 プロダクト・マーケティング・マネジャー 羽鳥正明氏に聞いた。
D2Dバックアップの需要を受け皿に
米データドメインが重複排除NASであるData Domainシリーズを世に出したのは、2003年にさかのぼる。Data Doaminでは、データがディスクに書き込まれる前に、以前保存されていたかどうかをブロック単位でチェック。冗長に保持しているモノは一方を削除し、ポインタ情報のみを保持する。こうしたいわゆる重複排除の処理により、バックアップのデータ容量自体を大幅に削減し、物理容量を抑えることができる。「今となっては重複排除も市場として認知されていますが、当時はこうしたユニークな製品はありませんでした。データドメインが市場を引っ張ってきたといえると思います」(羽鳥氏)という。
データ容量の増加という課題に対し、ストレージ容量を増やすのではなく、データ自体を削除するという同社のアプローチは、ユーザーの立場に立った斬新な提案だったといえる。特に運用管理の手間のかかる磁気テープからディスクツーディスク(D2D)へというバックアップトレンドの変化において、重複排除は大きく注目を集めることとなった。結果として、2009年にはEMCが同社を買収。羽鳥氏は、「EMCが買収する以前にすでにIPOしていましたし、買収金額も先頃のアイシロンとあまり変わりませんでした」ということで、高い評価を得た結果のEMC入りだったことをアピールする。以降、EMC Data Domainとして進化を続けているのはご存じのとおりだ。
強みはパフォーマンスとデータの整合性
Data Domainが他社より優れている技術として、羽鳥氏はパフォーマンスの高さを挙げる。
重複排除は処理のタイミングにより、ディスクに書き込む前に処理を行なうインライン型と、データをいったん保存してバックエンドで処理を行なうポストプロセス型の2種類がある。羽鳥氏は「もともと重複排除の計算処理はヘビーであるため、ポストプロセスを採用するところが多いのですが、IBMとカンタム、そしてデータドメインの3社はインラインでの処理を実現しています。さらにData Domainだけがディスクにキャッシュせず、純粋にCPUとメモリのみで処理を行なえます」とData Domainの優位点を説明する。
これを可能にしたのが、「SISL(Steam-Informed Segment Layout)」という特許取得済みの技術を採用したアルゴリズム。データを可変長のブロックに分割して、フィンガープリント値を生成するのは他と同じだが、「サマリベクター」という数学的な手法でおおざっぱな仕分けをメモリ上でやってしまう。そしてサマリベクターで判断できないデータのみを、キャッシュ上のフィンガープリントと照合し、誤判定を防ぐのだ。さらにフィンガープリントをプリフェッチすることで、次回のディスクアクセスを大幅に削減するのも高速化に貢献する。
ディスクの速度に依存しないSISLの採用により、CPUの高速化とともに、処理能力も並列して向上するという。最近では、重複排除の処理をバックアップサーバー側と分担することで、パフォーマンスを向上させる「DD Boost」というオプションも用意しているほか、重複排除バックアップソフト「EMC Avamar」との連携も発表している。
また、データの整合性を保ったまま保存できる点も大きい。「テープやNASにデータを保存しても、定期的にベリファイいないと、いざリカバリしたいときにデータが正しく読めないということが発生します。その点、Data Domain OSでは書き込む際にチェックサムを計算し、以降はデータの整合性をチェックしています」(羽鳥氏)という。こうした機能を持つため、バックアップはもちろん、ファイルを長期保存するアーカイブの用途にも向く。実際、2011年の2月には長期保存用の「DD Archiver」も市場に投入している。
DRサイトの転送でデータ削減
製品はアプライアンス形態で提供されており、国内では物理容量で最大6TBの「DD610」から最大384TBのDD890、さらにヘッドを2つ持つGlobal Duplication Array、DD Archiverまでを展開している。
用途としては、やはりテープからD2Dへの移行、そして複数のバックアップシステムの統合が多い。「1回目から大きな効果が出る訳ではありませんが、保存期間が延びれば伸びるほど効果が高くなってきます」とのことで、重複排除の効果はやはり高いと語る。また、最近は災害対策での用途も増えている。「重複除外後のデータをリモートまで送ればよいので、回線を増強する必要がありません」(羽鳥氏)ということで、DRサイトの利用に最適だという。災害対策という面で、今後も注目を集めることになるだろう。
この連載の記事
-
第22回
サーバー・ストレージ
サーバーの次に注目されるストレージの仮想化 -
第20回
サーバー・ストレージ
データ保護の技術 可用性を高める技術 -
第19回
データセンター
「i」に対応!IBMの「リモート・データ保護」が対象拡充 -
第19回
サーバー・ストレージ
バス変更などで性能4倍!日本IBMのストレージ「XIV Gen3」 -
第19回
サーバー・ストレージ
データを守るRAIDとストレージのネットワーク化 -
第17回
サーバー・ストレージ
自動階層化で効率化を追求したDell Compellent -
第17回
サーバー・ストレージ
ハードディスクと外付けディスクアレイ装置 -
第16回
サーバー・ストレージ
再評価されるテープライブラリの最高峰「HP ESL G3」 -
第15回
サーバー・ストレージ
日本SGI、最大1PBのストレージ「InfiniteStorage 5500」 -
第14回
サーバー・ストレージ
自動階層化とPowerShellに対応した新SANsymphony-V -
第13回
サーバー・ストレージ
クラウドの4要素は「NetApp OnCommand」で管理できる - この連載の一覧へ