このページの本文へ

前へ 1 2 次へ

社内のあらゆる人がデータ活用に乗り出すための第一歩

“データ活用を促す”ためのデータカタログの条件とは? 基本から教わった

2024年07月09日 09時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 企業でデータ活用の機運が高まる中、データ環境の構成要素のひとつとして注目されるのが「データカタログ」だ。調査会社ITRの発表(2024年1月)によると、国内企業でもデータカタログの有用性に対する理解が深まっており、2022~2027年度の国内データカタログ市場の年間平均成長率(CAGR)は18.3%と予測されている。

 データカタログの役割をひと言で言えば「企業内にあるデータを一元管理すること」だ。ただし、本来の目的は「企業におけるデータ活用を促進すること」であり、この目的を果たさなければ意味がないはずだ。企業内でのデータ活用を促すために、データカタログにはどんな要件が求められるのだろうか。

 今回は、データ基盤支援サービスの「TROCCO(トロッコ)」や、データカタログサービスの「COMETA(コメタ)」を提供するprimeNumberの鈴木健太氏、廣瀬智史氏に、データカタログの基本的な役割から、データ活用の促進に求められる機能や組織の要件まで幅広く聞いた。

primeNumber プロダクト本部 プロダクトマネージャーの廣瀬智史氏、同社 取締役執行委員 CTO/エンジニアリング本部長の鈴木健太氏

「データ活用の民主化」の第一歩となるデータカタログ

 まずは、ごく基本的な疑問として「なぜデータカタログが必要なのか」を尋ねてみた。鈴木氏は「データカタログが『データ活用の民主化』を推進する重要な役割を果たすからです」と答える。社内のあらゆる部門でデータ活用が進む「データ活用の民主化」によって、新たなビジネス価値が生まれやすくなるのは間違いないだろう。

 「primeNumberでは『あらゆるデータを、ビジネスの力に変える。』というコーポレートビジョンを掲げています。企業内のデータは『存在する』だけでは価値がなく、『活用する』ことで初めてビジネスの力になります」(鈴木氏)

 データカタログは、企業内のさまざまなシステムに分散しているデータ資産をインベントリ(目録)として整理し、一元管理を可能にするサービスである。データを活用したい社員は、このデータカタログにアクセスすることで、自社のどこにどんなデータがあるのかを自ら「発見」できる。

鈴木氏

 鈴木氏は、企業がデータ活用のすそ野を社内で広げるときに、データカタログの重要性に気づくケースが多いと指摘する。具体的には“データを集め、蓄積する人”と“データを活用する人”が別々の人になった段階で、データをめぐるコミュニケーション課題が発生し、データカタログへのニーズが高まるという。

 「社内でのデータ活用の規模が小さく、一部の社員だけが自らデータを集め、データ活用に取り組んでいるうちは、データカタログがなくても『どこにどんなデータがあるのか』を把握できるでしょう。しかし、データを活用したい社員の数が増え、扱うデータの数や種類も増える、つまりデータ活用の規模が大きくなるにつれて『どこに何のデータがあるのかわからない』という課題も大きくなっていきます」(鈴木氏)

「データの意味」を理解するためのメタデータ管理も重要な役割

 データカタログのもうひとつの役割としては、「『データの意味』を正しく理解したうえで活用できるようにすること」があるという。これはどういうことか。

 「たとえば、社内に売上データがあったので活用しようと考えても、数字だけでは税込金額か税抜金額かわかりません。これではデータ分析に活用できませんし、扱いを間違えれば誤った意思決定につながるおそれすらあります。そこで、データカタログでは『この売上データは税抜金額である』といったデータの意味を示す情報、『メタデータ』を付与してデータを管理できるようになっています」(鈴木氏)

 データカタログ上で、データに付与されたメタデータを参照することで、自分が必要としているデータかどうかが判断できるし、誤った理解に基づくデータ利用も防げるわけだ。

 廣瀬氏によると、メタデータは一般に「テクニカルメタデータ」と「ビジネスメタデータ」に大別されるという。テクニカルメタデータは「このデータはどのデータベースから来たのか(抽出されたのか)」「いつ更新されたデータか」といった情報、一方のビジネスメタデータは「売上金額は税込か税抜か」「この『売上』はどこまでの範囲を含むものか」など業務寄りの“用語の定義”とも言える情報である。

 「テクニカルメタデータとビジネスメタデータは、どちらも重要なものです。たとえば、更新日が確認できれば先月の売上データを確定前に使ってしまうような事故が防げますし、ビジネスドメインごとに異なる定義がなされているデータをめぐってコミュニケーションが混乱することもないでしょう。データカタログでは、この“両輪”がうまくサポートされていることが大切だと思います」(廣瀬氏)

 付与されるメタデータを社内で統一するために、データカタログでは一般に、言葉の定義を行う用語集の機能、必須のメタデータ項目を規定するテンプレート機能などが用意されている。また、メタデータから効率的にデータの探索を行うディスカバリー機能も重要だという。

廣瀬氏

 もうひとつ、データカタログを導入することで、連携させたデータベースやデータウェアハウスのスキーマ情報などを自動的に取得し、データテーブルどうしの関係を構造化したER図を含めて一元的に見られるようになる。こうした情報をExcelのスプレッドシートなどで(手作業で)管理している現場も多いため「データ管理の工数も大きく削減されます」と廣瀬氏は説明する。

前へ 1 2 次へ

カテゴリートップへ

アクセスランキング

  1. 1位

    デジタル

    実は“無謀な挑戦”だったルーター開発 ヤマハネットワーク製品の30年と2025年新製品を振り返る

  2. 2位

    ITトピック

    「全国的に大変な状況になっています」 盛岡のSIerが見た自治体システム標準化のリアル

  3. 3位

    ゲーム

    信長を研究する東大教授、『信長の野望』を30年ぶりにプレイ 「若い頃だったら確実にハマってた」

  4. 4位

    ゲーム

    92歳 vs 95歳が『鉄拳8』でガチ対決!? “ご長寿eスポーツ大会”が海外でも話題に

  5. 5位

    sponsored

    SIer/ネットワーク技術者こそ知ってほしい! 「AV over IP」がもたらすビジネスチャンス

  6. 6位

    デジタル

    ヤマハ、2026年夏にWi-Fi 7対応アクセスポイント投入 スケルトンモデルも追加で「見せたくなる」デザインに

  7. 7位

    TECH

    NTTが日比谷を「光の街」に。次世代通信技術を都市にインストール

  8. 8位

    ITトピック

    セキュリティ人材の課題は人手不足ではなく「スキル不足」/生成AIのRAG導入が進まない背景/日本で強いインフレ悲観、ほか

  9. 9位

    ビジネス・開発

    10年先にいる「将棋界」から学ぶ 強豪将棋AI・水匠チームが語る“人を超えたAI”との向き合い方

  10. 10位

    TECH

    2026年度始動の「サプライチェーンセキュリティ評価制度」 企業セキュリティが“客観評価”される時代に

集計期間:
2025年12月21日~2025年12月27日
  • 角川アスキー総合研究所