このページの本文へ

数百億個のファイル調査で得た知見をレポートで公表、“情報ガバナンス”確立を訴える

「企業の保管ファイル、41%は無用のもの」ベリタス調査結果

2016年03月24日 07時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 「企業がストレージに保管しているファイルのうち、41%は過去3年間に一度も更新されておらず、データ保管コストの大きな無駄づかいになっている」。ベリタステクノロジーズは3月23日、企業が保有する非構造化データについてのレポートを公開した。ビジネスデータとその保管コストが急拡大する中で、企業に対し“情報ガバナンス”の確立を訴えている。

米ベリタステクノロジーズ シニアプロダクトマーケティングマネージャのクリストファー・タルボット氏

ベリタス日本法人 常務執行役員 テクノロジーセールス&サービス統括本部の高井隆太氏

保管ファイルのメタデータを収集/分析して新たな知見を得る

 ベリタスが公開したレポート「Data Genomics Index(データ ゲノミクス インデックス)日本語版」は、昨年(2015年)、同社の「NetBackup」ソリューションを導入している顧客企業の一部から協力を受けて実態調査と分析を実施したもの。レポートのPDFが同社サイトでダウンロードできる(リンクは本文末)。

 具体的には、調査協力企業のプライマリストレージに格納された数百億個のファイルからメタデータ(ファイルタイプやサイズ、作成からの経過時間、所有者など)を収集し、それをさまざまな角度から分析したものとなる。調査対象社数は明かされていないが、幅広い国/業種/規模の顧客が協力しており、「一般的な企業のデータ環境」についての知見が得られたという。

「Data Genomics Index」は、実在の企業が保有する数百億個のファイルメタデータを収集/分析したレポート

 同レポートによると、ファイル数は年平均増加率「39.2%」のペースで増え続けており、今後はさらに指数関数的な増加が予測されている。ちなみに、必要となるストレージ容量は、数の増加よりもさらに9%高い割合で増加しているという。

2007年を基点とした、ファイル数(青線)と容量(赤線)の増加率の高まり(レポートPDFより)。今後、さらに指数関数的に増加していくと予想されている

 ファイルタイプ別の分析では、ストレージ容量全体の3分の1を画像ファイル、アプリの開発中ファイル、圧縮ファイルが占めていることや、10年前と比べてプレゼンテーションファイル数が大幅に減少(481%の減少)していることなどもわかっている。

ファイルタイプ別のストレージ占有状況。画像ファイル、開発中ファイル、圧縮ファイルの3つだけで、ストレージ容量の3分の1を占めている

データ保管コストの41%はムダ? 「41%問題」とは

 そして冒頭でも述べたとおり、企業のプライマリストレージのデータ容量のうち、41%を「過去3年間、一度も更新されていないファイル」が占めていた(法規制やコンプライアンスで保管義務のあるデータを除く)。同社はこれを「陳腐化したファイル」と呼ぶ。説明会に出席した米ベリタスのクリストファー・タルボット氏は、次のように語った。

 「企業はデータ保管コストの41%を、もはや誰も更新しないようなファイルの保管に費やしている。これが今回の調査で最大の発見だ」(タルボット氏)

保管ファイル全体のうち41%は3年間、さらに12%は7年間以上更新されていないファイル。それだけ無駄なデータ保管コストが生じている。ベリタスは「なぜ、すべてを保存しておくのですか?」と問いかける

 タルボット氏はこれを“41%問題”と呼び、「たとえば10PBのストレージ環境を保有する企業の場合、こうした陳腐化ファイルの保管に、年間で2050万ドル(約25億円)を費やしている可能性がある」と指摘する。

 だが、こうしたファイルの内容を1個ずつ確認し、破棄するかアーカイブ化するかなどと対応を判断していくのは非現実的だ。個人レベルでのファイル整理ならまだしも、先述した10PBのストレージ環境で考えると、陳腐化したファイル(4.1PB)の個数は「およそ95億個」という膨大なものとなり、とても人手では対応できそうにない。

 タルボット氏は“41%問題”を解決するために、企業は「(対応するデータの)優先順位を決めなければならない」と語った。陳腐化している割合の高いファイルタイプや、容量の大きなファイルタイプはどれかを知ることで、判断の基準となる。たとえば、陳腐化ファイルの20%程度を占めるという古い形式のOfficeドキュメント(プレゼンテーション/表計算/文書/テキストファイル)をアーカイブに移行することで、ストレージコストを50%削減できるという試算を示した。

Officeドキュメントだけでなく、ファイルあたりの容量が大きい動画や音声、仮想化イメージなどに絞って対策を進めることを推奨

 「(41%問題対策の)プロジェクトをどこから始めるにせよ、まずは保管データの状況を可視化するところからスタートしなければならない。ベリタスの情報ガバナンス製品群は、そうした可視化能力を提供できる」(タルボット氏)

 ただし、陳腐化データのアーカイブ移行や削除について、誰が責任者となってプロジェクトを進めていくのかは難しい問題だ。タルボット氏も「それは顧客が直面するであろう課題の1つだ」と認めたうえで、先進的な顧客では専任の幹部(CDO:Chief Data Officer)などの役職が出来つつある現状を説明した。

情報保護だけでなく“情報ガバナンス”の確立を訴える

 ベリタス日本法人の高井隆太氏は、企業がデータにまつわる「コスト」と「リスク」をどう管理するのかが“情報ガバナンス”であり、企業はそれを確立していかなければならないことを訴えた。

 「大量のファイルやその属性(メタデータ)を分析することで、新しい知見を生み出すことができる。バックアップやアーカイブの製品を通じて、ベリタスはそうした情報にアクセスできるベンダーである」(高井氏)

ベリタスでは「Information Map」や「Data Insight」といった、企業が保有するデータへの“可視性”をもたらす情報ガバナンス製品群をラインアップしている

 また同社 セールスエンジニアリング本部 プリンシパルセールスエンジニアの前田隆志氏は、すでに企業が行っている情報保護の対策に、情報ガバナンスのエッセンスを加えることで「保有している情報を最適化したうえで、保存、管理していくことができる」とまとめた。

データの所有者や重要度、作成時期などを明確にすることで、削除やアーカイブも含むポリシーに沿った対応が可能となる

 なお同日、ベリタスではアーカイブ製品の最新版「Enterprise Vault 12」と非構造化データ分析製品の最新版「Data Insight 5.1」を発表している。Enterprise Vaultでは、機械学習エンジンを採用した査閲レビューの学習機能、画像データに含まれるテキストをOCRでインデックス化する機能などが追加された。

カテゴリートップへ

  • 角川アスキー総合研究所
  • アスキーカード