リーガルテックAI企業はなぜVeeamのバックアップ製品を選んだか

文●大塚昭彦/TECH.ASCII.jp

2019年10月31日 07時00分

 バックアップ/データ保護ソリューションベンダーのヴィーム・ソフトウェアが2019年9月12日に開催したプライベートカンファレンス「VeeamON FORUM Tokyo 2019」。同イベントでは、「Veeam Backup and Replication Enterprise Plus」の導入顧客として“リーガルテックAI”企業のFRONTEO(フロンテオ)が登壇し、データ保護が欠かせない同社ビジネスにおけるVeeam製品導入の経緯、実環境における導入設計のポイント、導入後に得られた価値などを説明した。

「VeeamON FORUM Tokyo 2019」で登壇した、FRONTEO クライアントテクノロジー部 シニア テクニカル エキスパートの松山渉氏

「eディスカバリ」「フォレンジック」のためにデータを預かる

 FRONTEOは、日本のほか韓国、台湾、米国にも現地法人を展開するリーガルテックAI企業だ。主に米国の訴訟対応におけるeディスカバリ(電子情報開示)やフォレンジック調査(デジタル鑑識)のワンストップサービス/ソリューション、およびそのトレーニングを、顧客であるグローバル企業や政府機関などに提供する。

 FRONTEOでは、顧客組織が保有する膨大な電子ドキュメントからの証拠収集/特定や不正発見を可能にする、自然言語処理をベースとした独自のAIエンジン「KIBIT」を開発している。これにより、英語のみならず日本語、中国語、韓国語などの多言語を含むドキュメントを正確に処理することができる。さらに現在では、ここで培ったAI技術を基に、ビジネスインテリジェンスやヘルスケアなど他分野への事業展開も進めている。

eディスカバリ、フォレンジック事業におけるFRONTEOの実績

 今回登壇した松山氏は、インフラエンジニアとして、こうしたITインフラの運用に加えて、ハイパーコンバージドインフラ(HCI)やSDS(Software-Defined Storage)、SDN(Software-Defined Network)などのソリューション選定と基盤設計も行っている。

 基幹ビジネスのひとつであるeディスカバリのシステムでは、訴訟に関連する顧客の業務文書やメールなど膨大な量のデータをFRONTEOが預かり、訴訟支援のために検索しやすいかたちに整えたうえで保管することになる。ITインフラは国ごとに構築されているが、日本国内だけで仮想化ホスト(物理サーバー)はおよそ60台、1500~1600の仮想マシン(VM)が稼働しており、扱うデータはおよそ1ペタバイトに及ぶ規模だという。

シンプルで高性能、統合運用が可能なバックアップ製品を探しVeeamへ

 FRONTEOでは2017年4月の台湾を皮切りに、日本、韓国のシステム環境においてVeeamのバックアップソリューションを導入している。導入のきっかけは、これまで運用してきたバックアップ環境のリプレースだったという。

 Veeam導入以前、FRONTEOではバックアップ専用ソフトウェアを導入していなかった。その代わりに仮想化基盤が備えるVMのクローン機能や、ストレージ製品が備える機能を使うなどしてデータを保護していたという。しかし、複数のバックアップ手法が混在することでその設定は複雑なものとなり、ストレージ専門エンジニアがほぼ張りついて作業しなければならない状況だったという。さらにバックアップ処理そのものにも時間がかかっていたほか、バックアップポリシーの一貫性やコストの最適化といった課題も抱えていた。

 「バックアップのプロダクトがたくさんあり、正常にバックアップできているかどうかの状態確認がほぼ不可能。どこにバックアップされているのか突き合わせてみないとわからなかったり、反対に複数のストレージ間でバックアップデータが重複していたりと、作業負荷が高く効率が悪い状態だったので、バックアップ環境の統合が必要だった」(松山氏)

 既存バックアップ環境の課題を解消すべく、松山氏は「シンプルで高スループット、統合運用可能なバックアップソリューション」を求めて、複数のバックアップソフトウェアを検討していった。具体的には、HCI環境(=VMware vSANの分散クラスタ環境)でもストレージ専用機と遜色ないバックアップ処理性能を実現する「パフォーマンス」、シンプル化によって専任担当者を不要にし、バックアップデータも一箇所に集約できる「オペレーションの統合」、さらにバックアップしたVMを即座に起動できるインスタントリストア、初回フルバックアップの大容量データをオフラインで移送できるシーディングなどの要件があった。

 PoCも実施したうえで、こうした細かな要件をすべて満たすものとして採用されたのがVeeamのソリューションだったという。操作がシンプルであること、個別機能に追加ライセンスが必要ないこともVeeam製品の魅力だった、と松山氏は述べている。

HCI/SDSやストレージ専用機が混在する環境でもシンプルに統合できる

 VeeamON FORUMの講演において松山氏は、特に、導入したVeeam製品が幅広い構成形態のITインフラをシンプルにカバーできる点を強調した。

 VMware環境のバックアップを行う最も基本的な構成は、VMware vCenterホストとESXiホスト(バックアップ対象)を、Veeamのコントローラー(管理ホスト)とネットワーク接続するというものだ(NBD転送モード)。松山氏は、最小限のこの構成だけでも「十分に機能する」が、バックアップ処理のワークロードとトラフィックもESXiホストが処理することになり、負荷が大きくなる点には注意すべきだと説明する。

 次にHCI環境だ。vSANによる分散ストレージ環境の場合、VeeamはESXiホストの代わりにプロキシサーバーへ接続する。具体的には、プロキシのロールをアサインしたWindows ServerのVMを複数個用意して、HCIインフラ上に分散配置する。全体の規模にもよるが、FRONTEOでは4~6個の仮想コアを割り当てた仮想マシン2つを、いくつかのHCIマシン上に「適当にばらまく」だけで、「10Gbpsのバックアップ用帯域を使い切るほどのパフォーマンスが出ている」と語った。バックアップ処理にどのプロキシを使うか、負荷分散もVeeamのデフォルト設定のままで自動的に決定してくれるという。

最もシンプルな構成と、HCI環境におけるプロキシを用いた構成

 バックアップ対象として外部ストレージ(SAN)がある場合はどうか。この場合はVeeamホストとプロキシ、そして外部ストレージとをSAN経由で接続する。この構成にすることで、Veeamが仮想基盤の構成を自動的に読み取り、バックアップジョブの実行時にはSAN経由で直接バックアップデータがストレージから転送されることになる。つまり、バックアップトラフィックがESXiホストを迂回するため、前述したような負荷が発生しない。

 松山氏は、この構成で「一般企業が求めるレベルのパフォーマンスは達成できるはず」だとするが、環境によってはさらにシビアなパフォーマンス要件があるかもしれない。その場合は、ストレージ側が備えるスナップショット機能との連携が有効だ。SAN経由でのVeeamの接続先にストレージ管理ホストを加えることで、Veeam側のバックアップジョブ実行と連動してストレージがスナップショットを取得し、それをバックアップデータとして転送する仕組みだ。本番ワークロードのパフォーマンス影響が最も少ない構成であり、NetAppストレージを導入しているFRONTEOでも「その恩恵を最大限に享受できている」と松山氏は説明した。

SANストレージを組み合わせた構成と、ストレージのスナップショット機能と連携する構成

 そしてもちろん、日々の運用監視やバックアップジョブの設定などは、すべて統合された管理コンソールから実行できる。使いこなしもシンプルなため専任担当者が不要であり、「バックアップ運用と人とを切り離せる」と松山氏は説明した。これにより、社内のIT人材はより“攻めのIT”へと注力できるようになっている。

シードデータのオフライン移送、インスタントVMリカバリなど多様な機能

 Veeamの導入によって、FRONTEOが求めていたそのほかの要件も満たされたという。

 たとえば、前述したとおりFRONTEOの保護対象環境は1ペタバイト超の規模である。そのため、初回バックアップ処理(フルバックアップ)時には大容量データ(シードデータ)の転送が必要であり、現実的にリモート転送は不可能だ。Veeamのバックアップデータはふつうのファイルとして扱うことができ、シードデータをローカルのUSBストレージやJBOD、NASなどに保存したうえでオフラインで移送し、移送先でそこから続けて差分バックアップを実行できる。

 またバックアップファイルを直接使って高速に保護対象環境を復旧することができる「インスタントVMリカバリ」機能、同じくバックアップファイルを直接使い、隔離環境でVMを起動できる「バーチャルラボ」機能なども活用しているという。

 インスタントVMリカバリによって、障害や災害の発生時にもデータのリストア処理を待つことなく、短時間での環境復旧が実現する。またバーチャルラボを使えば、差分バックアップで合成されたVMが正常に起動するかどうかを実際にテストすることができるため、「これまでの環境で『何となく不安だから』実行していたフルバックアップの頻度を減らすことができる」(松山氏)。

 Veeamの導入効果はどうか。たとえば従来のバックアップ環境では、遠隔への3TBの差分バックアップに2~3日を要していたが、Veeamによって数時間で完了するようになったという。

Veeamが備える多様な機能によって、FRONTEOがバックアップ環境に求めていた幅広い要件がカバーされた

「単なるバックアップから、より価値の高い業務へと変えていく」

 「Veeamはバックアップのデータやオペレーションを、より価値の高いものに変える可能性を秘めていると考えている」。講演のまとめとして、松山氏はこう述べた。

 たとえばVeeamの提供するさまざまな機能を基準として考えることで、ストレージ購入にあたっての要件を軽減し、より柔軟なシステム設計と最適化されたコストを実現できる。バックアップという業務は、しばしば予算や運用リソースが適切にサイジングされない、軽視されがちな存在だが、ストレージ連携やインスタントVMリカバリ、バーチャルラボといった機能群をベースに、仮想環境との高度なオーケストレーション、自動化も図ることができるからだ。

 「従来のように、単に『バックアップやリストアができます』というだけでなく、Veeamの能力を生かして幅広い運用改善につなげたいと考えている。たとえばパッチ適用やテスト作業などの効率化、さらに将来的にはオートフェイルオーバ、Veeamがビジョンに掲げる“ハイパーアベイラビリティ”のような世界も期待できる」(松山氏)

 現状でもすでにそうした業務効率化に役立っているという。たとえばFRONTEOが保有するバックアップデータを顧客に提供する際に、これまでは動作確認などで長いワークフローが生じていた。だが、Veeamが備えるバーチャルラボを利用すればそのテストが大幅に自動化できる。

 松山氏は、Veeamソリューションの評価は古いPCやサーバーでも十分に可能で、スモールスタートから段階的にスケールしていけることなどを聴講者に紹介したうえで、「皆さんもぜひ、この先を見据えて、Veeamを使う第一歩を踏み出してみてはどうか」と呼びかけ、講演を締めくくった。

■関連サイト

■関連記事