NTTドコモ、データXも登壇、「SNOWDAY JAPAN 2023」基調講演レポート
Snowflake、技術者向けイベントで「Snowpark」など最新技術を紹介
2023年02月17日 07時00分更新
Snowflake(スノーフレイク)は2023年2月14日、技術者向け年次イベント「SNOWDAY JAPAN 2023」をANAインターコンチネンタル東京(東京・赤坂)で開催した。3000人以上が事前登録し、基調講演の内容はオンラインでも配信した(3月末までオンデマンド配信中)。
同イベントでは、米国本社エグゼクティブを含むSnowflakeの社員のほか、パートナーやユーザーが登壇する各種セッションを通じてデータアナリティクスやデータエンジニアリング、データサイエンス、アプリケーション開発を変革する同社の最新技術と、同社が提唱する「データクラウド」による最新イノベーションを紹介した。
「データクラウド」での企業間データ共有/取引がさらに加速
基調講演の冒頭ではSnowflake 社長の東條英俊氏が登壇、まず同社が提唱する「データクラウド」について説明した。
東條氏は「データクラウドは、Snowflakeが推進する“データのネットワーク”」だと語る。DWH、データレイク、データエンジニアリングといったデータプラットフォームだけでなく、データのシェアリング/エクスチェンジ(共有/取引)が可能なデータマーケットプレイスも統合し、データどうしの結びつきを実現することで、より高度なインサイトを得ることを可能にする。こうしたデータコラボレーションの姿を、Snowflakeではデータクラウドと呼んでいる。
「この3年間でデータの結びつきが発展した。日本でも、Snowflakeのプラットフォーム上でデータクラウドを推進する企業が増加している。Snowflakeでは金融サービス、ヘルスケア・製薬、製造・サプライチェーン、小売・消費財といったインダストリーごとに、必要とされるデータを集めて使いやすい環境を提供している」(東條氏)
続いて登壇した米Snowflake CFOのマイク・スカペリ氏は、急成長を遂げる同社の業績を紹介した。2020年9月の上場時には「エンタープライズソフトウェア企業として市場最大規模の上場」と言われ、50億ドル以上のネットキャッシュを創出。それに基づいて戦略的な投資を推進することで、高い成長を維持している。
最新事業年度(2022年2月~2023年1月期)の売上高見込みは19億2000万ドルで、前年比68%以上の成長になる。顧客数はグローバルで7300社となり、そのうち400社は日本企業だ。Forbesの「Global 2000」企業の28%がSnowflakeを利用している。4年前には1000人を切る程度だった従業員数も、現在では5000人以上に拡大した。
「Snowflakeは今後も高い成長が続く。そのなかでも、継続的に投資をしているのが日本市場だ。将来的には日本の売上が全体の10%を占めるようになると予測している」(スカペリ氏)
同社では、データクラウド上で企業どうしが6週間以上にわたってアクティブにデータ共有を行う状況を「ステーブルエッジ」と呼ぶが、その数も前年比112%増と大きく拡大しているという。
スカペリ氏は、同社にとって最も重要な価値は「カスタマーファースト」だと語り、その裏付けとしてNPSは72と非常に高い水準にあることを示した。
「この数年間で、顧客との対話は『テクノロジー重視』から『ビジネス成果重視』へと変化している。これは、データ戦略を通じていかにお客様のミッションや目標を達成するのかという議論に変わってきた、と言い換えることもできるだろう。ただし、これらの目標を達成するために、インフラやデータマネジメントが邪魔になってはいけない。Snowflakeはそうしたボトルネックを解消することができる。データクラウドは抽象的な存在ではなく『生きたデータネットワーク』であり、いまも成長を続けている」(スカペリ氏)
「クロスクラウド」の強力なコアプラットフォーム
米Snowflake プロダクト担当上級副社長のクリスチャン・クライナーマン氏、日本法人 マーケティング本部シニアプロダクトマーケティングマネージャー兼エヴァンジェリストのKT氏は、Snowflakeの最新機能などを紹介した。
Snowflakeと従来のデータプラットフォームとの違いについて、クライナーマン氏は「単一のプラットフォーム上にすべてのデータを載せ、単一のエンジンで処理することに加えて、ガバナンスの強化、グローバルな接続、セルフマネージドでの機能の使いやすさ、プログラム可能なオプション、そしてマーケットプレイスの提供」といった点を挙げる。
そのうえで「プラットフォームの中核(コア)」「データクラウドのコンテンツ」「Snowflake上での開発」という3つの側面から、Snowflakeの特徴と最新機能を説明した。
ひとつめの「プラットフォームの中核」については、コンセプトの中心にあるのは「クロスクラウド」だと述べた。データがどのリージョンのどのクラウドにあっても、さらには複数企業間で共有されているデータであっても、独自技術の「Snowgrid」によって常に最新の状態に保たれる。
「Snowgridにより、データのローカル性やデータレジリエンシー、クラウドの選択肢などを実現しながら、Snowflakeはひとつのシステムとして機能する。ETLやデータコピーは必要なく、データの変更はすぐに反映される。堅牢なデータガバナンスによって、プライバシーを保護しながら、データの活用と共有ができる」(クライナーマン氏)
Snowgridは、データやサービス、アプリケーションを瞬時に発見/アクセス/共有できる「コラボレーション」、データに沿ったフレキシブルなポリシー/タグ/系統を、クロスクラウド環境でも、すべてのユーザー/ワークロードに対して一貫して適用できる「ガバナンス」、変化するデータ規制への対応やクラウド間の移行を実現する最高水準の弾力性で実現することで実現するクロスクラウドでの「事業継続性」を達成。「クロスクラウドの柔軟性を生かしながら、ひとつのクラウドサービスが停止してもデータを失わない、システム障害を感じることがない環境を実現できる」(KT氏)とした。
また「Snowflakeマーケットプレイス」のデモでは、自分が欲しいデータを検索/取得して開くだけで、他社が保有するデータであっても、もともと自分のデータベースに存在していたかのように利用できる様子を紹介した。なおデータの提供側でも有償/無償のほか、ポリシーの設定やカラムベースのマスキングなど、詳細な提供方法を選択できる。
なお、Snowflakeでは伸縮性のある(スケーラブルな)エンジンを採用しているが、その改善によって3年間で平均20%のコスト削減効果につながっているという。また現在、「Apache Iceberg」テーブルへの対応や、トランザクションデータ/分析データを組み合わせて利用するハイブリッドテーブルの実現に取り組んでいると紹介した。
「機能」「アプリ」の共有、そしてアプリ開発基盤としても利用可能に
2つめの「データクラウドのコンテンツ」では、Snowflake上でデータの共有だけでなく「機能の共有」「アプリの共有」もできることを強調した。
クライナーマン氏によると、現在「Powered by Snowflake」と呼ぶパートナープログラムが進行中だ。これはパートナーと共同でSnowflakeのデータクラウド上にソリューションを構築するもので、ソリューション構築手法を共有するとともに、共同での市場導入施策も行っている。ユーザーは、Snowflake上のデータをコピーすることなく、パートナーソリューションにアクセスして付加価値機能を利用したデータ活用を行うことができる。
3つめの「Snowflake上での開発」については、「データパイプライン」「機械学習モデル」「アプリケーション開発」のそれぞれを紹介した。クライナーマン氏は、アプリ開発の改革は「Snowflakeの新たな進化」であり、これまでのアナリティクスやコラボレーションを補完するものになると説明する。
Snowflakeがアプリケーションに注力する理由は、Snowflakeの外でアプリケーションを開発すると、データのガバナンスやセキュリティの統一性が失われて“サイロ”ができてしまうからだという。
なお、開発者向けフレームワークの「Snowpark」では現在、PythonやJava、Scala、SQLといった言語をサポートしている。Snowflake for Pythonは2022年11月に一般提供を開始(GA)し、Snowparkを活用してアプリケーション開発を行う企業は6倍に拡大、またコストを半減させる効果も生まれている。なお、Pythonフレームワークである「Streamlit」を利用すれば、Snowflake上でビジュアル性に優れたWebアプリケーションを開発できる。
データパイプラインについては、毎日1PB(1ペタバイト)以上のデータを取り扱えるSnowflakeの強みを説明した。また遅延なしでデータを取り込む「Snowpipeストリーミング」により、10秒以下でイベント生成からテーブルでクエリ可能になるという高い性能を実現していることにも触れた。
ユーザー企業としてNTTドコモ、データXが登壇
Snowflakeのユーザー企業としてまず登壇したのはNTTドコモだ。同社の「dポイント」サービスでは、約9200万人の会員についておよそ3万項目のデータを蓄積しており、そのデータ活用を強化するためにSnowflakeを採用している。
NTTドコモ 情報システム部データ基盤担当 担当部長の日影浩隆氏は、「慣れ親しんだクラウドを活用してもデータ活用の未来がないと考えた。Snowflakeはデータガバナンスがしっかりと構築されていたことに加えて、データ活用に対するビジョンや、ユーザーの声を反映した機能強化に対する期待感も大きかった」と語る。
Snowflakeの柔軟性を生かし、NTTドコモではデータ活用に関する社内のさまざまな要望に対応している。利用開始から1年足らずで、オンプレミスのユーザー数に匹敵するほどに利用が進み、データ活用人材の強化にもつながったという。
「外部の気象データを活用したり、ガバナンスを効かせたグループ内でのデータ共有を行ったり、パートナーともデータを移転することなく、プライバシーを保護しながらデータ共有ができる。Snowflakeの進化により、データに近いところでの分析や、アプリの利用が促進され、お客様の価値提供につなげることができる」(日影氏)
続いて、IT教育事業を展開するスタートアップのデータX 執行役員 CTOの井戸端洋彰氏が登壇した。データXでは、データマーケティングプラットフォームの「b-dash」にSnowflakeを採用したことで、処理に時間がかかっていたクエリが大幅に短縮され、パフォーマンスを向上させながらコストを30~40%削減できたという。フルマネージドで運用人員の削減にもつながり、顧客向けサービス拡大に貢献していると述べた。
「現在はSnowparkの活用も検討しており、さまざまなアプリをSnowflake上で稼働させたり、Streamlitを利用しながらアプリによるデータプラットフォームの活用につなげたりすることで、新たな価値を生むことができると考えている。さらに、データ加工などを行うデータパレットの機能を切り出して、マーケットプレイスで提供することも検討している」(井戸端氏)
* * *
基調講演の最後にクライナーマン氏は、「Snowflakeの提案は、顧客に対して使い勝手の良い環境を提供し、ソフトウェアやインフラの今後の進化を心配することなくSnowflakeに任せてもらい、データやデータモデル、洞察を活用して、プロダクトやサービスの改善に注力してもらうということ」だと述べた。
「今後の進化のなかではコンテンツは重要である。マーケットプレイスではデータセットプロバイダーがより増加し、より多くのアプリケーションプロバイダーがリスティングされるだろう。データパイプラインや機械学習を活用したソリューション開発を加速することになる。ロードマップでは、今後も驚くような発表が控えている」(クライナーマン氏)