このページの本文へ

コスト削減100本ノック 第39回

やはりコストは人件費。ETL活用でプロジェクトを見直そう

【39本目】データ統合ツールで人海戦術を排除したら?

2010年06月18日 09時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

異なるシステムやアプリケーション同士のデータ移行は、人海戦術で行なうことが多い。しかし、専用のETLと呼ばれるツールで行なえば、作業は自動化され、新システムへの移行もいち早く実現する。ETLツールで高いシェアを誇るインフォマティカにコスト削減の効果を聞いた。

データ移行や同期に潜む不都合な果実

 ERPやメインフレームのシステムを新環境に移行する、各種データをデータウェアハウスに入れ込む、オンプレミスのシステムとSaaSを連携させる。業務システムにはデータ移行がつきものだ。複数のデータを移行するだけではなく、統合、同期、交換、分配などといった作業が必要になるが、異なるシステムのデータにそれぞれの仕様があり、玩具のブロックのように簡単には操作できない。

インフォマティカジャパン セールスコンサルティング部 ソリューションアーキテクト 並木 正之氏

 また、そもそも仕様どおりにデータが登録されていないことも多い。本来、登録されていなければならないフィールドが空白だったり、ダミーの数字が入っているようなことはよくある。郵便番号が5桁表記だったり、そもそもデータの文字コード自体が違う可能性もある。「ある生保会社で調べたら、10%以上が仕様書通りではありませんでした。また、古いシステムだと仕様書やデータ自体が残っていないことも多いです」と、長年データ統合の苦労を見てきたインフォマティカジャパンの並木 正之氏はこう述べる。

 特に競合の製品同士や比較的マイナーな製品の場合、そのデータ移行は困難を極め、結局は人海戦術でコピー&ペーストを行なうといった作業を行なっていることも多い。並木氏は「1回ごとのプロジェクトであれば人海戦術でなんとかなると考えているユーザーも多いのですが、大きな誤解といえます。メインフレーム、ERP、クラウドなど変化はますます速くなっており、新しいアプリケーションもどんどん増えており、ますますプロジェクトは、複雑化しているからです」と警鐘を鳴らす。昨今では会計システムのデータベースから必要なデータを抽出し、データウェアハウスに転送するといったリアルタイムなシステム連携も要求される。

ETLツールの活用で
プロジェクトのコストを下げる

 こうしたデータの移行、統合、交換、同期、分配といった一連の「データ統合」を実現するのが、ETLと呼ばれるツールだ。ETLはExtract(抽出)/Transformation(変換)/Load(ロード)という統合までの3つのプロセスを指しており、マルチベンダー&オープン化の流れからデータ統合のニーズが高まり、1990年代の後半に登場した製品ジャンルだ。

 インフォマティカは1996年に創業したETLの専業ベンダーで、ETLプラットフォーム「PowerCenter」を中心に幅広いデータ統合をカバーする。AからBへの単純なデータ移行ではなく、さまざまなアプリケーションへの移行、さまざまなデータ統合の形態をサポートする、まさにアプリケーションの「ハブ」として機能する。並木氏曰く「私たちは、この製品を業務と業務をくっつける『糊』と呼んでいます。また独立系なので、MISO(Microsoft、IBM、SAP、Oracle)などのベンダーを問わず、相互にデータを行き来させ、連携できます。最近ではSaaSのようなオンラインアプリケーション連携も可能になっています。」という特徴を持つ。

インフォマティカの提供するデータ統合プラットフォーム

 実際のPowerCenterでのデータ統合について見ていく。まず、PowerCenterでは、データの変換ロジックをリポジトリという形で格納する。「1人のプログラマが作っても、設計図があるので、他の人でも容易に直せます。部品が決まっていて、標準化されているので、初心者でも立ち上がりが速いのです。変換ロジックを特定の技術者に依存しないようにすることが可能なのです」(並木氏)。

 また、PowerCenterには、データソースに接続するPowerExchangeとデータ品質を管理するData Qualityというツールが用意されている。PowerExchangeではメインフレームやERP、データベースなどあらゆるデータにアクセスし、取得や転送が行なえる。もう一方のData Qualityは対象となるデータの内容、構造、品質を自動的に分析(プロファイリング)し、変換ロジックの開発を支援する。あとは文字コードを統一して、不正データを振り分け(クレンジング)たうえで、ロジックに従って変換を行ない、ターゲットシステムにデータを転送する。当然、自動処理できないデータは例外として業務システムに手動での変換処理を依頼することになる。

データ品質管理の処理フロー例

投資の回収期間は約18カ月

 こうしたETLの導入効果は、多くの導入事例で明らかになっている。データ移行時間やトレーニング期間の短縮、ハードウェアコストの削減、レガシーソフトウェアの廃止、エラーや不正確なデータの抑止、手作業によるデータ照合の排除などなど。同社がフォレスタ・リサーチに委託し、7社の顧客に対して行なった投資対効果の分析では、3年間での投資対効果を88%、投資の回収期間を18カ月と割り出している。

 並木氏は「新しいシステムの導入に際して大体ライセンスコストが約1/3で、7割はコンサルティング、残りがトレーニング費用だと思います。しかし、近年はシステムの入れ替え期間も短いので、トータルコストに足が出ると聞いています。こうしたシステム移行において、インフォマティカのツールでプログラムの平準化と標準化を進めていただくと大きなコスト削減効果が得られるといえるでしょう」と語る。

 今後、増えてくるのがオンプレミスからSaaS・クラウドへの移行だ。「SAPからSalesforceへ移行するなんてプロジェクトは、数千万円が相場で、数ヶ月もかかります。しかし、PowerCenterを使えば、難しいプログラミングなしに数十時間で連携プログラムができます」(クラウド)とのことで、クラウドの導入を加速するエンジンとして、PowerCenterは今後も進化を続ける。

カテゴリートップへ

この連載の記事
  • 角川アスキー総合研究所
  • アスキーカード