ノバセル:「データ基盤に大切なものは“アジリティ”」と語る理由
続いて、TV CMの効果分析/運用サービスを提供するノバセルのエンジニア、山中雄生氏が登壇し、およそ2年間のSnowflake活用事例を紹介しながら、データ基盤におけるアジリティ(機動性)の重要さについて説明した。
ノバセルは2017年、ラクスルの新規事業として立ち上がったスタートアップだ。2020年にはTV CMの効果可視化ツール「ノバセルアナリティクス」を、また2022年には競合TV CMを分析するツール「ノバセルトレンド」を提供開始している。2023年には最短20分でアンケートが取れるツール「ノビシロ」もローンチした。「マーケティングの民主化」が大きなテーマだ。
ノバセルがデータ基盤を導入したのは、ノバセルアナリティクスとノバセルトレンドのローンチ時期の間にあたり、山中氏は「データ基盤の導入は、われわれのビジネスのスケールにとって重要だった」と振り返る。
「ノバセルのビジネスは『データを売るビジネス』。データ基盤とは、その商品(データ)を作る工場だと言える。強力なデータ基盤を導入したことで、ビジネスのスケールを支えることができた」(山中氏)
ノバセルはデータ基盤をどのように導入、構築してきたのか。山中氏はイノベーションを起こすためのキーワードである“Think Big, Start Small, Scale Fast”という言葉を紹介した。まず大きなビジョンを定めたうえで、小さな課題解決からスタートして、その取り組みを素早く拡張していく――という意味だ。「ノバセルが取り組んで来たデータ基盤導入の道のりも、このキーワードに当てはまるのではないか」と語る。
「まず最初は“Think Big”。データ基盤を導入してどういう理想を実現したいのか、ビジョンを定めることを考えた。次に“Start Small”。われわれはスタートアップであり、理想ばかり追いかけてもいられないので、まずは目の前の課題にフォーカスして解決することに取り組んだ。そして現在は“Scale Fast”の段階。データ活用を進めてさらにビジネスを拡大していくために、企画開発を推進している」(山中氏)
具体的にはどうだったのか。まずデータ基盤構築やデータ活用のビジョンとしては、ノバセルが企業ビジョンとして掲げる「マーケティングの民主化」をサポートするものとして「データですべてのプロセスをエンパワーする」という言葉を定めた。
次は、解決すべき課題の設定だ。山中氏は、データ基盤導入前の最大の課題は「データがデータベースにしか存在しないこと」だったと語る。ノバセルアナリティクスでは、顧客企業から集客データなどを収集し、それをノバセルが持つCM放映データと掛け合わせることで、CMの効果分析を行っている。ただし、大規模なデータをすべてデータベースに格納していたため、高いストレージコストがかかっていたうえに、パフォーマンスの低下やアプリケーションどうしの処理影響なども発生していた。
そこで、データレイクとDWH(Snowflake)を導入することで課題解決を図った。大規模データはデータレイクに蓄積してストレージコストを削減するとともに、分析済みデータはデータベースからSnowflakeにコピーし、Snowflake上で活用するようにしてパフォーマンスを向上させた。
データ基盤の導入後、新サービスとしてノバセルトレンドをリリースしたが、こちらの開発においても課題が生じた。数千万行以上に及ぶ大規模データの収集/分析、検索データ等の外部データとの連携、また外部データのその他用途での活用といった課題だ。
ここでは、Snowflakeをより高度に活用して「データアクティベーション」にトライしたという。具体的には、外部データをすべてSnowflakeに取り込み、Snowflake上で分析をかけて、その結果のみをデータベースに格納するという方法だ。アプリケーションからはこのデータベースにアクセスすることで、パフォーマンス低下を防いだ。
こうしてデータ基盤を構築し、課題を解決してきたノバセルだが、また新たな課題に直面しているという。現在はビジネスサイドでもデータ活用の期待とニーズが高まっているが、営業データがExcelやSalesforce、Zoomなどに分散しており、データサイロ化の課題が生じているという。
その解決策として、山中氏は「オーソドックスなアプローチだが、あらゆるデータをSnowflakeに集約して“Single Source of Truth”とし、分析に活用する」と説明した。すべてのデータがここに集約されており、それを自由に掛け合わせて分析できるため「分析の機動力が向上する」と期待を述べる。
およそ2年間のデータ基盤構築経験を総括して、山中氏は「データ基盤に大切なものは“アジリティ”」だと語った。
「取り組む前は、データ基盤は大きくて変化の少ない、基幹システムのようなものというイメージでとらえていたが、実際はまったく違っていた。活用目的も要件もすごい速さで変わっていくので、それに素早く対応できるようにツール、組織、システムを整えることが重要だ」(山中氏)。
truestar:各種オープンデータをすぐに使える形で無料公開
3人目に登壇したtruestarの藤 俊久仁氏は、同社がSnowflakeマーケットプレイスで無償提供している「Prepper Open Data Bank」について紹介した。
Prepper Open Data Bankは、官公庁がさまざまな形式で公開しているオープンデータを収集し、企業のデータアナリストやデータサイエンティストなどがすぐに使える形式に加工したうえで、Snowflakeのマーケットプレイスで公開しているものだ。「無料で使える」「営利目的でも自由に使える(Creative Commonsライセンス)」「一元管理されているので探す手間が省ける」という3つの特徴を持つ。
「よく言われることだが、データ分析では分析前のデータプレパレーションに8割の時間が費やされている。『ここを何とか打破できないか』と、2年前から始めたのがPrepper Open Data Bankだ。さまざまな省庁がオープンデータを公開しているが、使う側はそれを探して、集めて、加工しないと使えないのが現状。結局みんなが同じ作業をしているのは不毛なので、誰かがやって公開すればいいと思って始めた」(藤氏)
同サービスでは、人口統計や人流、地価、鉄道、天気、法人情報、カレンダー(祝日)など、汎用性の高い基礎データが提供されており、すでにさまざまな企業が自社データと掛け合わせてデータ分析を行っている。
なお同日、Prepper Open Data Bankの新たなデータとして、TSUIDEと法人番号が収集/加工した企業の従業員数データが公開された。今後はこのデータのように、truestar以外の企業や個人が提供している加工済みオープンデータも連携して取り込み、ユーザーの利便性を高めていく方針だという。
同説明会はこのあと、法人番号株式会社の吉田裕宣氏が、500万社超のユニークIDである法人番号データを使い、Salesforce上に登録された取引先データの一括修正をライブデモで披露したほか、経産省 大臣官房DX室の栁澤直孝氏が、政府保有法人データのオープンデータ化の取り組みについて紹介した。