このページの本文へ

最新エンタープライズストレージの実力を探る 第11回

WAN回線の増強は不要!災害対策での需要も急増

Data Domainが実現するテープバックアップとの決別

2011年06月20日 09時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

重複排除専用のストレージという新しいジャンルを作ったEMCの「Data Domain」。災害対策やDRという観点でも注目を集めるData Domainのストレージについて、EMCジャパン BRS事業本部 プロダクト・マーケティング・マネジャー 羽鳥正明氏に聞いた。

D2Dバックアップの需要を受け皿に

 米データドメインが重複排除NASであるData Domainシリーズを世に出したのは、2003年にさかのぼる。Data Doaminでは、データがディスクに書き込まれる前に、以前保存されていたかどうかをブロック単位でチェック。冗長に保持しているモノは一方を削除し、ポインタ情報のみを保持する。こうしたいわゆる重複排除の処理により、バックアップのデータ容量自体を大幅に削減し、物理容量を抑えることができる。「今となっては重複排除も市場として認知されていますが、当時はこうしたユニークな製品はありませんでした。データドメインが市場を引っ張ってきたといえると思います」(羽鳥氏)という。

EMCジャパン BRS事業本部 プロダクト・マーケティング・マネジャー 羽鳥正明氏

 データ容量の増加という課題に対し、ストレージ容量を増やすのではなく、データ自体を削除するという同社のアプローチは、ユーザーの立場に立った斬新な提案だったといえる。特に運用管理の手間のかかる磁気テープからディスクツーディスク(D2D)へというバックアップトレンドの変化において、重複排除は大きく注目を集めることとなった。結果として、2009年にはEMCが同社を買収。羽鳥氏は、「EMCが買収する以前にすでにIPOしていましたし、買収金額も先頃のアイシロンとあまり変わりませんでした」ということで、高い評価を得た結果のEMC入りだったことをアピールする。以降、EMC Data Domainとして進化を続けているのはご存じのとおりだ。

強みはパフォーマンスとデータの整合性

 Data Domainが他社より優れている技術として、羽鳥氏はパフォーマンスの高さを挙げる。

 重複排除は処理のタイミングにより、ディスクに書き込む前に処理を行なうインライン型と、データをいったん保存してバックエンドで処理を行なうポストプロセス型の2種類がある。羽鳥氏は「もともと重複排除の計算処理はヘビーであるため、ポストプロセスを採用するところが多いのですが、IBMとカンタム、そしてデータドメインの3社はインラインでの処理を実現しています。さらにData Domainだけがディスクにキャッシュせず、純粋にCPUとメモリのみで処理を行なえます」とData Domainの優位点を説明する。

Data Domainで高速な処理を実現するインラインの重複排除

 これを可能にしたのが、「SISL(Steam-Informed Segment Layout)」という特許取得済みの技術を採用したアルゴリズム。データを可変長のブロックに分割して、フィンガープリント値を生成するのは他と同じだが、「サマリベクター」という数学的な手法でおおざっぱな仕分けをメモリ上でやってしまう。そしてサマリベクターで判断できないデータのみを、キャッシュ上のフィンガープリントと照合し、誤判定を防ぐのだ。さらにフィンガープリントをプリフェッチすることで、次回のディスクアクセスを大幅に削減するのも高速化に貢献する。

Data Domainにおける重複排除のフロー

 ディスクの速度に依存しないSISLの採用により、CPUの高速化とともに、処理能力も並列して向上するという。最近では、重複排除の処理をバックアップサーバー側と分担することで、パフォーマンスを向上させる「DD Boost」というオプションも用意しているほか、重複排除バックアップソフト「EMC Avamar」との連携も発表している。

 また、データの整合性を保ったまま保存できる点も大きい。「テープやNASにデータを保存しても、定期的にベリファイいないと、いざリカバリしたいときにデータが正しく読めないということが発生します。その点、Data Domain OSでは書き込む際にチェックサムを計算し、以降はデータの整合性をチェックしています」(羽鳥氏)という。こうした機能を持つため、バックアップはもちろん、ファイルを長期保存するアーカイブの用途にも向く。実際、2011年の2月には長期保存用の「DD Archiver」も市場に投入している。

DRサイトの転送でデータ削減

 製品はアプライアンス形態で提供されており、国内では物理容量で最大6TBの「DD610」から最大384TBのDD890、さらにヘッドを2つ持つGlobal Duplication Array、DD Archiverまでを展開している。

Data Domainの製品ラインナップ

 用途としては、やはりテープからD2Dへの移行、そして複数のバックアップシステムの統合が多い。「1回目から大きな効果が出る訳ではありませんが、保存期間が延びれば伸びるほど効果が高くなってきます」とのことで、重複排除の効果はやはり高いと語る。また、最近は災害対策での用途も増えている。「重複除外後のデータをリモートまで送ればよいので、回線を増強する必要がありません」(羽鳥氏)ということで、DRサイトの利用に最適だという。災害対策という面で、今後も注目を集めることになるだろう。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

アクセスランキング

  1. 1位

    トピックス

    思い切った慶應義塾 全教職員にNotion導入で168年分の知的資産をAIに食わせるプロジェクトが始動

  2. 2位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  3. 3位

    ビジネス

    管理職こそ大事にしないとまずくないか? 約4割が「続けたい、と答えない」現実

  4. 4位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  5. 5位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  6. 6位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  9. 9位

    TECH

    合成ゴムが及ばない天然ゴムの高性能のメカニズムを、現象発見から100年後に解明

  10. 10位

    ビジネス

    なぜか「決裁権者」と「学生」がこぞって聴いてるポッドキャストの謎

集計期間:
2026年04月13日~2026年04月19日
  • 角川アスキー総合研究所