このページの本文へ

前へ 1 2 次へ

Snowflakeがデータ活用の事例説明会を開催

3人の“データ・スーパーヒーロー”が語る、Snowflakeとデータ活用の最前線

2023年04月04日 08時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

ノバセル:「データ基盤に大切なものは“アジリティ”」と語る理由

 続いて、TV CMの効果分析/運用サービスを提供するノバセルのエンジニア、山中雄生氏が登壇し、およそ2年間のSnowflake活用事例を紹介しながら、データ基盤におけるアジリティ(機動性)の重要さについて説明した。

ノバセルでは、TV CMをWeb広告のように分析し、運用できるサービスを提供している

 ノバセルは2017年、ラクスルの新規事業として立ち上がったスタートアップだ。2020年にはTV CMの効果可視化ツール「ノバセルアナリティクス」を、また2022年には競合TV CMを分析するツール「ノバセルトレンド」を提供開始している。2023年には最短20分でアンケートが取れるツール「ノビシロ」もローンチした。「マーケティングの民主化」が大きなテーマだ。

 ノバセルがデータ基盤を導入したのは、ノバセルアナリティクスとノバセルトレンドのローンチ時期の間にあたり、山中氏は「データ基盤の導入は、われわれのビジネスのスケールにとって重要だった」と振り返る。

 「ノバセルのビジネスは『データを売るビジネス』。データ基盤とは、その商品(データ)を作る工場だと言える。強力なデータ基盤を導入したことで、ビジネスのスケールを支えることができた」(山中氏)

データ基盤を導入したことでビジネスのスケールが可能になった

 ノバセルはデータ基盤をどのように導入、構築してきたのか。山中氏はイノベーションを起こすためのキーワードである“Think Big, Start Small, Scale Fast”という言葉を紹介した。まず大きなビジョンを定めたうえで、小さな課題解決からスタートして、その取り組みを素早く拡張していく――という意味だ。「ノバセルが取り組んで来たデータ基盤導入の道のりも、このキーワードに当てはまるのではないか」と語る。

 「まず最初は“Think Big”。データ基盤を導入してどういう理想を実現したいのか、ビジョンを定めることを考えた。次に“Start Small”。われわれはスタートアップであり、理想ばかり追いかけてもいられないので、まずは目の前の課題にフォーカスして解決することに取り組んだ。そして現在は“Scale Fast”の段階。データ活用を進めてさらにビジネスを拡大していくために、企画開発を推進している」(山中氏)

 具体的にはどうだったのか。まずデータ基盤構築やデータ活用のビジョンとしては、ノバセルが企業ビジョンとして掲げる「マーケティングの民主化」をサポートするものとして「データですべてのプロセスをエンパワーする」という言葉を定めた。

データ基盤導入の道のりも“Think Big, Start Small, Scale Fast”だったと山中氏は語る

 次は、解決すべき課題の設定だ。山中氏は、データ基盤導入前の最大の課題は「データがデータベースにしか存在しないこと」だったと語る。ノバセルアナリティクスでは、顧客企業から集客データなどを収集し、それをノバセルが持つCM放映データと掛け合わせることで、CMの効果分析を行っている。ただし、大規模なデータをすべてデータベースに格納していたため、高いストレージコストがかかっていたうえに、パフォーマンスの低下やアプリケーションどうしの処理影響なども発生していた。

 そこで、データレイクとDWH(Snowflake)を導入することで課題解決を図った。大規模データはデータレイクに蓄積してストレージコストを削減するとともに、分析済みデータはデータベースからSnowflakeにコピーし、Snowflake上で活用するようにしてパフォーマンスを向上させた。

データ基盤導入前は、分析対象や分析結果のデータがすべてデータベースに格納されており、それがコスト高/パフォーマンス低下を招いていた

 データ基盤の導入後、新サービスとしてノバセルトレンドをリリースしたが、こちらの開発においても課題が生じた。数千万行以上に及ぶ大規模データの収集/分析、検索データ等の外部データとの連携、また外部データのその他用途での活用といった課題だ。

 ここでは、Snowflakeをより高度に活用して「データアクティベーション」にトライしたという。具体的には、外部データをすべてSnowflakeに取り込み、Snowflake上で分析をかけて、その結果のみをデータベースに格納するという方法だ。アプリケーションからはこのデータベースにアクセスすることで、パフォーマンス低下を防いだ。

新サービス開発においても課題が生じたが、データ基盤をさらに活用して解決した

 こうしてデータ基盤を構築し、課題を解決してきたノバセルだが、また新たな課題に直面しているという。現在はビジネスサイドでもデータ活用の期待とニーズが高まっているが、営業データがExcelやSalesforce、Zoomなどに分散しており、データサイロ化の課題が生じているという。

 その解決策として、山中氏は「オーソドックスなアプローチだが、あらゆるデータをSnowflakeに集約して“Single Source of Truth”とし、分析に活用する」と説明した。すべてのデータがここに集約されており、それを自由に掛け合わせて分析できるため「分析の機動力が向上する」と期待を述べる。

 およそ2年間のデータ基盤構築経験を総括して、山中氏は「データ基盤に大切なものは“アジリティ”」だと語った。

 「取り組む前は、データ基盤は大きくて変化の少ない、基幹システムのようなものというイメージでとらえていたが、実際はまったく違っていた。活用目的も要件もすごい速さで変わっていくので、それに素早く対応できるようにツール、組織、システムを整えることが重要だ」(山中氏)。

truestar:各種オープンデータをすぐに使える形で無料公開

 3人目に登壇したtruestarの藤 俊久仁氏は、同社がSnowflakeマーケットプレイスで無償提供している「Prepper Open Data Bank」について紹介した。

 Prepper Open Data Bankは、官公庁がさまざまな形式で公開しているオープンデータを収集し、企業のデータアナリストやデータサイエンティストなどがすぐに使える形式に加工したうえで、Snowflakeのマーケットプレイスで公開しているものだ。「無料で使える」「営利目的でも自由に使える(Creative Commonsライセンス)」「一元管理されているので探す手間が省ける」という3つの特徴を持つ。

 「よく言われることだが、データ分析では分析前のデータプレパレーションに8割の時間が費やされている。『ここを何とか打破できないか』と、2年前から始めたのがPrepper Open Data Bankだ。さまざまな省庁がオープンデータを公開しているが、使う側はそれを探して、集めて、加工しないと使えないのが現状。結局みんなが同じ作業をしているのは不毛なので、誰かがやって公開すればいいと思って始めた」(藤氏)

「Prepper Open Data Bank」の概要と、公開しているオープンデータ

 同サービスでは、人口統計や人流、地価、鉄道、天気、法人情報、カレンダー(祝日)など、汎用性の高い基礎データが提供されており、すでにさまざまな企業が自社データと掛け合わせてデータ分析を行っている。

 なお同日、Prepper Open Data Bankの新たなデータとして、TSUIDEと法人番号が収集/加工した企業の従業員数データが公開された。今後はこのデータのように、truestar以外の企業や個人が提供している加工済みオープンデータも連携して取り込み、ユーザーの利便性を高めていく方針だという。

活用事例と、新たに追加された従業員数データ(日本年金機構の被保険者数ベース)

 同説明会はこのあと、法人番号株式会社の吉田裕宣氏が、500万社超のユニークIDである法人番号データを使い、Salesforce上に登録された取引先データの一括修正をライブデモで披露したほか、経産省 大臣官房DX室の栁澤直孝氏が、政府保有法人データのオープンデータ化の取り組みについて紹介した。

前へ 1 2 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    ビジネス・開発

    いますぐ捨てたいITサービスは? AI推しにそろそろ飽きてません? 情シスさんのホンネを「ゆるっとナイト」で聞いた

  2. 2位

    ITトピック

    「AI導入で人員を減らしても収益は増えない」その理由/「専任情シス不在」中小企業の3社に2社/ユーザーアカウント流出が加速、ほか

  3. 3位

    エンタープライズ

    基盤も古いし、コードも酷い! そんなクエストにGitHub Copilotで試行錯誤しまくった「みんな」こそ最高

  4. 4位

    Team Leaders

    Power AutomateでSharePoint APIを使う ― SPOリストを自動作成するフローを作ろう

  5. 5位

    sponsored

    完全自動運転の実現へ、チューリングが開発基盤にGMO GPUクラウドを選んだ理由

  6. 6位

    ソフトウェア・仮想化

    日本の自治体がみんな使っている「ManageEngine」 IT運用のすべての課題解決を目指す

  7. 7位

    クラウド

    「すでに開発コードの4分の3はAI生成」 Google Cloud CEO、エージェント時代の戦略を語る

  8. 8位

    スマホ

    ここまで便利なのか! 子どもの居場所を90秒間隔で教えてくれる、安心の見守りガジェットがすごいぞ

  9. 9位

    ビジネス・開発

    「粗悪記事」「ゼロクリック」「搾取」からクリエイターをどう守るか? AIに強いnoteが挑む創作エコシステム

  10. 10位

    ソフトウェア・仮想化

    AIエージェントを野放しにしない ― ServiceNowは“AI司令塔”で自律とガバナンスを両立

集計期間:
2026年05月11日~2026年05月17日
  • 角川アスキー総合研究所