Pythonサポート、クロスクラウドアカウント同期、非構造化データ対応など、日本語サポートも強化
Snowflakeがデータクラウドの大型アップデートを発表
2021年11月24日 07時00分更新
Snowflakeは2021年11月17日(米国時間)、グローバル年次カンファレンス「SNOWDAY」の開催にあわせ、同社のデータクラウド「Snowflake」のアップデートを発表した。Pythonサポート、クロスクラウドアカウントレプリケーション、非構造化データ対応など、同社が掲げる4つのイノベーションのテーマに沿ったかたちで機能強化がなされている。
日本の報道陣向けに発表を行ったSnowflake 製品担当SVPのクリスチャン・クレナマン氏は、「我々はデータのエンリッチメントを通して、より良い意思決定の機会を顧客に提供してきたいと考えている。今回の機能強化により、顧客のイノベーションと新しいビジネスモデルの構築に大きく貢献することができるだろう」と語り、“データクラウド”の進化に自信を見せた。
クレナマン氏は、Snowflakeが掲げるイノベーションのテーマとして以下の4点を挙げている。
・Build Faster … より高速なビルド
・Operate Globally … グローバルなオペレーション
・Elminate Silos … 組織内サイロの排除
・Create New Business … 新規ビジネスの創出
今回のアップデートは、いずれも上記4つのテーマに沿ったケイパビリティの拡張となっている。
○Snowflake for Python(プライベートプレビュー)/Build Faster
「高速なビルドエクスペリエンスの提供は、Snowflakeにおけるもっとも重要なケイパビリティ」というクレナマン氏の言葉にあるように、Snowflakeは「Snowpark」と呼ばれる開発者向けライブラリを提供しており、開発者はSnowparkを利用することでJavaやScalaなどで実装したコードをSnowflake内で直接実行することが可能となっている。コード内でDataFrameを用いてクエリを構築でき、Snowflakeのコンピュートエンジンがこれを実行するので、開発者はSQL文を書いて渡す必要がない。また、コードはSnowflake上に構築されたセキュアなサンドボックス上で実行されるため、運用における信頼性やセキュリティが担保されている。
今回、プライベートプレビューではあるがSnowparkでPythonをネイティブサポートする「Snowflake for Python」が発表されたことで、世界中のより多くの開発者、とくにAI/ML開発者やデータサイエンティストへのリーチが拡大すると見られる。また、Snowflakeは2021年9月にAnacondaとパートナーシップ契約を締結しており、SnowflakeユーザはAnacondaのもつ豊富なPythonライブラリに対してシームレスなアクセスが可能となっている。「Pythonはデータエンジニアリングのパイプラインとして高い人気を得ており、今回のサポートでさらなるユーザ層の拡大が期待できる」(クレナマン氏)。
なお、Pythonサポート以外のSnowparkアップデートとしては、ストアドプロシージャ(Snowpark API)、ロギングフレームワーク、Java UDF(ユーザ定義関数)を介した非構造化データのサポート(後述)などが発表されている(いずれもプライベートプレビューとしての提供)。
○グローバルレプリケーションとグローバルガバナンスの拡張/Operate Globally
Snowflakeは企業がマルチリージョン/クロスクラウドでデータを利用することを前提にサービスを設計しており、今回の発表でもシームレスで統合された運用をグローバルで実現するための機能拡張が図られている。
その中でももっとも注目すべきアップデートが「クロスクラウドアカウントレプリケーション」で、Snowflakeのネイティブなデータベースレプリケーション機能を拡張し、アカウントのメタデータ全体をクラウド/リージョンを超えて自動的に同期させ、継続的な可用性を担保することが可能になっている。レプリケートされるメタデータにはID、ロールベースのアクセスコントロール、ガバナンスポリシー、リソースモニタなどが含まれ、さらにプライマリリージョンとのポイントインタイムの一貫性も確保される。メタデータの扱いを得意とするSnowflakeらしい機能強化といえる(現時点ではプライベートプレビュー)。
また、Snowflakeのある大規模ユーザはデータベースレプリケーション改善により55%のパフォーマンス向上が見られたとしている。クレナマン氏は「Snowflakeは従量課金型のサービスなので、この結果はすべての顧客にとってレプリケーションコストが55%削減されることを意味している」と話す。
運用関連のそのほかのアップデートとしては、アクセス履歴におけるデータリネージ可視化、オブジェクトの依存関係(Object Dependencies)、コンディショナルマスキング、匿名化などがいずれもプライベートプレビューとして発表されている。また、Snowflakeのパートナー企業とともにSnowflakeのデータガバナンスを向上するエコシステムプログラム「Data Governance Accelerated」もあわせて発表されており、AccentureやSatoriなど21社が参加している。
○非構造化データのサポート/Elminate Silos
Snowflakeはデータ活用のプロセスを徹底的にシンプル化することをめざしており、「Snowflakeの創業者たちがとくにフォーカスしたのが組織内サイロの解消」(クレナマン氏)であるのも、サイロの乱立にともなう複雑性を排除し、データ活用をシンプルにすることを重要なミッションにしているからにほかならない。
サイロを排除し、データプラットフォームのシンプル化を実現する有力な方法のひとつがシングルプラットフォームにデータを統合することだが、そのためにはあらゆるデータをサポートし、さらにデータメッシュやデータレイクなどさまざまなアーキテクチャのパターンを実装できることが求められる。
そうしたニーズからSnowflakeが今回発表したのが非構造化データのサポート拡張(プライベートプレビュー)で、前述のSnowparkでのJava UDFによる非構造化データのサポートのほか、RBAC(ロールベースのアクセスコントロール)やセキュアシェアリング、ディレクトリテーブルなどでも非構造化データをサポートする。クレナマン氏は「このアップデートで音声ファイルやPDFファイルの扱いが容易になり、ユースケースが拡大することが期待される」と話す。
○データマーケットプレイス/Create New Business
Snowflakeはデータプラットフォームとしての機能のほかに、プラットフォーム上のコンテンツをユーザどうしが発見/共有し、コラボレーションを進めるコンテンツプラットフォームとしての機能も備えている。今回のアップデートでは、データマーケットプレイスの機能拡張が図られており、ユーザはデータプロバイダからデータを直接購入できるだけでなく、購入前にトライアルオプションを利用することも可能となっている。
また、金融データを専門的に扱うFactSetがSnowflakeの金融サービスデータを活用したことでクライアントの総数を前年比88%増加させたり、営業支援のSaaSを提供するZoomInfoがデータマーケットプレイスにデータ掲載後の6週間で年間契約額を100万ドル増やすなど、データマーケットプレイスを活用した新しいユースケースも発表されており、コンテンツプラットフォームとしてのさらなる成長が期待される。
* * *
グローバルでのアップデートに加え、日本市場向けの取り組みとして「日本語によるテクニカルサポートの提供開始」が日本法人の社長執行役員である東條英俊氏から発表された。東條氏によれば、Snowflakeの国内ユーザは前年同期比で4倍以上に増えており、「より多くの国内ユーザにSnowflakeのサポートを日本語で提供していく必要がある」(東條氏)として、日本語サポートの拡充を決めたという。サポート時間は日本時間の平日9時30分から17時30分までで、電話による日本語対応も追加されている。また、西日本の営業所も新たに開設され、西日本のサポート体制も強化していく姿勢を示している。
クラウドネイティブなデータプラットフォームとして登場して以来、急速な成長を遂げているSnowflakeだが、クラスタ化したマイクロパーティション、コンピュートとストレージの分離、マルチクラウド/マルチリージョンによる可用性の担保、そしてセキュアなデータ共有とそれをベースにしたデータプレイスマーケットなど、既存のデータウェアハウスベンダとは大きく異なるアプローチで“データクラウド”という概念を世界に拡大してきた。「パフォーマンスとスケーラビリティには絶対の自信をもっている」と話すクレナマン氏だが、開発と運用、そしてユーザビリティにフォーカスした今回のアップデートは、Snowflakeが次のフェーズに進むための重要な試金石となりそうだ。