このページの本文へ

前へ 1 2 次へ

社内のあらゆる人がデータ活用に乗り出すための第一歩

“データ活用を促す”ためのデータカタログの条件とは? 基本から教わった

2024年07月09日 09時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 企業でデータ活用の機運が高まる中、データ環境の構成要素のひとつとして注目されるのが「データカタログ」だ。調査会社ITRの発表(2024年1月)によると、国内企業でもデータカタログの有用性に対する理解が深まっており、2022~2027年度の国内データカタログ市場の年間平均成長率(CAGR)は18.3%と予測されている。

 データカタログの役割をひと言で言えば「企業内にあるデータを一元管理すること」だ。ただし、本来の目的は「企業におけるデータ活用を促進すること」であり、この目的を果たさなければ意味がないはずだ。企業内でのデータ活用を促すために、データカタログにはどんな要件が求められるのだろうか。

 今回は、データ基盤支援サービスの「TROCCO(トロッコ)」や、データカタログサービスの「COMETA(コメタ)」を提供するprimeNumberの鈴木健太氏、廣瀬智史氏に、データカタログの基本的な役割から、データ活用の促進に求められる機能や組織の要件まで幅広く聞いた。

primeNumber プロダクト本部 プロダクトマネージャーの廣瀬智史氏、同社 取締役執行委員 CTO/エンジニアリング本部長の鈴木健太氏

「データ活用の民主化」の第一歩となるデータカタログ

 まずは、ごく基本的な疑問として「なぜデータカタログが必要なのか」を尋ねてみた。鈴木氏は「データカタログが『データ活用の民主化』を推進する重要な役割を果たすからです」と答える。社内のあらゆる部門でデータ活用が進む「データ活用の民主化」によって、新たなビジネス価値が生まれやすくなるのは間違いないだろう。

 「primeNumberでは『あらゆるデータを、ビジネスの力に変える。』というコーポレートビジョンを掲げています。企業内のデータは『存在する』だけでは価値がなく、『活用する』ことで初めてビジネスの力になります」(鈴木氏)

 データカタログは、企業内のさまざまなシステムに分散しているデータ資産をインベントリ(目録)として整理し、一元管理を可能にするサービスである。データを活用したい社員は、このデータカタログにアクセスすることで、自社のどこにどんなデータがあるのかを自ら「発見」できる。

鈴木氏

 鈴木氏は、企業がデータ活用のすそ野を社内で広げるときに、データカタログの重要性に気づくケースが多いと指摘する。具体的には“データを集め、蓄積する人”と“データを活用する人”が別々の人になった段階で、データをめぐるコミュニケーション課題が発生し、データカタログへのニーズが高まるという。

 「社内でのデータ活用の規模が小さく、一部の社員だけが自らデータを集め、データ活用に取り組んでいるうちは、データカタログがなくても『どこにどんなデータがあるのか』を把握できるでしょう。しかし、データを活用したい社員の数が増え、扱うデータの数や種類も増える、つまりデータ活用の規模が大きくなるにつれて『どこに何のデータがあるのかわからない』という課題も大きくなっていきます」(鈴木氏)

「データの意味」を理解するためのメタデータ管理も重要な役割

 データカタログのもうひとつの役割としては、「『データの意味』を正しく理解したうえで活用できるようにすること」があるという。これはどういうことか。

 「たとえば、社内に売上データがあったので活用しようと考えても、数字だけでは税込金額か税抜金額かわかりません。これではデータ分析に活用できませんし、扱いを間違えれば誤った意思決定につながるおそれすらあります。そこで、データカタログでは『この売上データは税抜金額である』といったデータの意味を示す情報、『メタデータ』を付与してデータを管理できるようになっています」(鈴木氏)

 データカタログ上で、データに付与されたメタデータを参照することで、自分が必要としているデータかどうかが判断できるし、誤った理解に基づくデータ利用も防げるわけだ。

 廣瀬氏によると、メタデータは一般に「テクニカルメタデータ」と「ビジネスメタデータ」に大別されるという。テクニカルメタデータは「このデータはどのデータベースから来たのか(抽出されたのか)」「いつ更新されたデータか」といった情報、一方のビジネスメタデータは「売上金額は税込か税抜か」「この『売上』はどこまでの範囲を含むものか」など業務寄りの“用語の定義”とも言える情報である。

 「テクニカルメタデータとビジネスメタデータは、どちらも重要なものです。たとえば、更新日が確認できれば先月の売上データを確定前に使ってしまうような事故が防げますし、ビジネスドメインごとに異なる定義がなされているデータをめぐってコミュニケーションが混乱することもないでしょう。データカタログでは、この“両輪”がうまくサポートされていることが大切だと思います」(廣瀬氏)

 付与されるメタデータを社内で統一するために、データカタログでは一般に、言葉の定義を行う用語集の機能、必須のメタデータ項目を規定するテンプレート機能などが用意されている。また、メタデータから効率的にデータの探索を行うディスカバリー機能も重要だという。

廣瀬氏

 もうひとつ、データカタログを導入することで、連携させたデータベースやデータウェアハウスのスキーマ情報などを自動的に取得し、データテーブルどうしの関係を構造化したER図を含めて一元的に見られるようになる。こうした情報をExcelのスプレッドシートなどで(手作業で)管理している現場も多いため「データ管理の工数も大きく削減されます」と廣瀬氏は説明する。

前へ 1 2 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    トピックス

    “持たない家電”ランキング、もはや定番のアレがやっぱり1位なような

  2. 2位

    トピックス

    思い切った慶應義塾 全教職員にNotion導入で168年分の知的資産をAIに食わせるプロジェクトが始動

  3. 3位

    ビジネス

    管理職こそ大事にしないとまずくないか? 約4割が「続けたい、と答えない」現実

  4. 4位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  5. 5位

    トピックス

    インバウンドの頑張りランキングベスト3は「大分県」「岐阜県」「佐賀県」 努力が光る結果に

  6. 6位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  7. 7位

    トピックス

    リモートワークは福利厚生なの? ITエンジニアが本当に欲しい福利厚生第1位となる

  8. 8位

    ビジネス

    ランチ抜きが22%!? 物価高で「水筒・コンビニ控え」が定着する中、なぜか「推し活・美容費」だけは死守するオフィスワーカーたち

  9. 9位

    TECH

    身代金要求攻撃の被害額は「1社平均6.4億円」 それでも6割超が「支払いを否定しきれない」苦境

  10. 10位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

集計期間:
2026年04月14日~2026年04月20日
  • 角川アスキー総合研究所