このページの本文へ

前へ 1 2 次へ

社内のあらゆる人がデータ活用に乗り出すための第一歩

“データ活用を促す”ためのデータカタログの条件とは? 基本から教わった

2024年07月09日 09時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 企業でデータ活用の機運が高まる中、データ環境の構成要素のひとつとして注目されるのが「データカタログ」だ。調査会社ITRの発表(2024年1月)によると、国内企業でもデータカタログの有用性に対する理解が深まっており、2022~2027年度の国内データカタログ市場の年間平均成長率(CAGR)は18.3%と予測されている。

 データカタログの役割をひと言で言えば「企業内にあるデータを一元管理すること」だ。ただし、本来の目的は「企業におけるデータ活用を促進すること」であり、この目的を果たさなければ意味がないはずだ。企業内でのデータ活用を促すために、データカタログにはどんな要件が求められるのだろうか。

 今回は、データ基盤支援サービスの「TROCCO(トロッコ)」や、データカタログサービスの「COMETA(コメタ)」を提供するprimeNumberの鈴木健太氏、廣瀬智史氏に、データカタログの基本的な役割から、データ活用の促進に求められる機能や組織の要件まで幅広く聞いた。

primeNumber プロダクト本部 プロダクトマネージャーの廣瀬智史氏、同社 取締役執行委員 CTO/エンジニアリング本部長の鈴木健太氏

「データ活用の民主化」の第一歩となるデータカタログ

 まずは、ごく基本的な疑問として「なぜデータカタログが必要なのか」を尋ねてみた。鈴木氏は「データカタログが『データ活用の民主化』を推進する重要な役割を果たすからです」と答える。社内のあらゆる部門でデータ活用が進む「データ活用の民主化」によって、新たなビジネス価値が生まれやすくなるのは間違いないだろう。

 「primeNumberでは『あらゆるデータを、ビジネスの力に変える。』というコーポレートビジョンを掲げています。企業内のデータは『存在する』だけでは価値がなく、『活用する』ことで初めてビジネスの力になります」(鈴木氏)

 データカタログは、企業内のさまざまなシステムに分散しているデータ資産をインベントリ(目録)として整理し、一元管理を可能にするサービスである。データを活用したい社員は、このデータカタログにアクセスすることで、自社のどこにどんなデータがあるのかを自ら「発見」できる。

鈴木氏

 鈴木氏は、企業がデータ活用のすそ野を社内で広げるときに、データカタログの重要性に気づくケースが多いと指摘する。具体的には“データを集め、蓄積する人”と“データを活用する人”が別々の人になった段階で、データをめぐるコミュニケーション課題が発生し、データカタログへのニーズが高まるという。

 「社内でのデータ活用の規模が小さく、一部の社員だけが自らデータを集め、データ活用に取り組んでいるうちは、データカタログがなくても『どこにどんなデータがあるのか』を把握できるでしょう。しかし、データを活用したい社員の数が増え、扱うデータの数や種類も増える、つまりデータ活用の規模が大きくなるにつれて『どこに何のデータがあるのかわからない』という課題も大きくなっていきます」(鈴木氏)

「データの意味」を理解するためのメタデータ管理も重要な役割

 データカタログのもうひとつの役割としては、「『データの意味』を正しく理解したうえで活用できるようにすること」があるという。これはどういうことか。

 「たとえば、社内に売上データがあったので活用しようと考えても、数字だけでは税込金額か税抜金額かわかりません。これではデータ分析に活用できませんし、扱いを間違えれば誤った意思決定につながるおそれすらあります。そこで、データカタログでは『この売上データは税抜金額である』といったデータの意味を示す情報、『メタデータ』を付与してデータを管理できるようになっています」(鈴木氏)

 データカタログ上で、データに付与されたメタデータを参照することで、自分が必要としているデータかどうかが判断できるし、誤った理解に基づくデータ利用も防げるわけだ。

 廣瀬氏によると、メタデータは一般に「テクニカルメタデータ」と「ビジネスメタデータ」に大別されるという。テクニカルメタデータは「このデータはどのデータベースから来たのか(抽出されたのか)」「いつ更新されたデータか」といった情報、一方のビジネスメタデータは「売上金額は税込か税抜か」「この『売上』はどこまでの範囲を含むものか」など業務寄りの“用語の定義”とも言える情報である。

 「テクニカルメタデータとビジネスメタデータは、どちらも重要なものです。たとえば、更新日が確認できれば先月の売上データを確定前に使ってしまうような事故が防げますし、ビジネスドメインごとに異なる定義がなされているデータをめぐってコミュニケーションが混乱することもないでしょう。データカタログでは、この“両輪”がうまくサポートされていることが大切だと思います」(廣瀬氏)

 付与されるメタデータを社内で統一するために、データカタログでは一般に、言葉の定義を行う用語集の機能、必須のメタデータ項目を規定するテンプレート機能などが用意されている。また、メタデータから効率的にデータの探索を行うディスカバリー機能も重要だという。

廣瀬氏

 もうひとつ、データカタログを導入することで、連携させたデータベースやデータウェアハウスのスキーマ情報などを自動的に取得し、データテーブルどうしの関係を構造化したER図を含めて一元的に見られるようになる。こうした情報をExcelのスプレッドシートなどで(手作業で)管理している現場も多いため「データ管理の工数も大きく削減されます」と廣瀬氏は説明する。

前へ 1 2 次へ

カテゴリートップへ

  • 角川アスキー総合研究所
  • アスキーカード