DataRobot、SnowflakeのSnowparkで推論をよりスケーラブルに
DataRobot, Inc.
さらなる連携強化により、データと機械学習モデルとの間にある「AI実運用化上の壁」を緩和
エンタープライズAIのリーダーであるDataRobot, Inc.(本社:マサチューセッツ州ボストン、CEO:Dan Wright、以下DataRobot)は、本日、データクラウド企業Snowflake(https://www.snowflake.com/?lang=ja)との新たな統合について発表しました。
今回の新たな連携の目的は、Snowflakeの新しい開発者向けツール「Snowpark」の価値をDataRobotユーザーに提供することです。先日発表されたZepl社の買収(https://www.datarobot.com/jp/news/datarobot-acquires-zepl-to-enhance-enterprise-ai-platform-capabilities-for-advanced-data-scientists/)に続く今回の連携により、トップデータサイエンティストが必要とする新たな機能がDataRobotのプラットフォーム上でも利用可能になりました。Snowflake Summit 2021で紹介したように、DataRobotのプラットフォームの一部となったZeplの機能は、主にSnowparkを用いたモデル開発向けに、事前設定済みのフル機能環境を提供することで、DataRobotとSnowflakeのユーザーがモデルを迅速に開発、トレーニング、デプロイすることを可能にします。こうした重層的なインテグレーションは、あらゆる企業のAI活用を強力にサポートするために、両社が以前から取り組む戦略的パートナーシップや各種インテグレーションの上に成り立つものです。
AIへの投資が増加(https://www.gartner.com/en/newsroom/press-releases/2020-10-01-gartner-survey-revels-66-percent-of-orgnizations-increased-or-did-not-change-ai-investments-since-the-onset-of-covid-19)する一方、AIのプロダクション(本番環境)への移行に苦労する企業は後を絶ちません。その原因は、機械学習モデルとデータの間でコンピューティング環境が異なるところにあります。データの量、種類、発生頻度が増大し続けるなか、モデル開発に必要なデータを機械学習モデルのあるコンピューティング環境に移すのが、ますます困難になっているのです。
この問題を解決するためにDataRobotが導入したのが、ポータブル予測サーバー(https://www.datarobot.com/blog/introducing-mlops-portable-prediction-servers/)です。このサーバーを使えば、DataRobotのあらゆるモデルを自社のプロダクション用データに近づけたり、既存のデータパイプラインやアプリケーションに統合したりすることが可能になります。
またSnowparkとJava UDF(ユーザー定義関数)機能の登場で、モデルをDataRobotからSnowflakeデータクラウドに直接移すというコンセプトを維持することができました。Java UDFとDataRobotのJavaスコアリングコードを連携させると、プロダクションモデルとデータの間で環境が異なるという問題が解消され、Snowflakeのデータクラウド内で、DataRobotモデルを使ったデータベース内のスコアリングが実行できるようになります。
Snowparkの機能を活用すれば、データエンジニアやデータサイエンティスト、開発者は好みの言語でモデリングのコードを書くことが可能になります。さらにETL/ELT、データプレパレーション、特徴量エンジニアリングといったワークロードを、パフォーマンス、スケーラビリティ、並行処理などの面でホスティング型の外部サービスより優れたSnowflakeデータクラウド内で実行できます。Snowparkがもたらすこれらの新機能により、スコアリングコードに対応したデプロイを使用して、データベース内での大規模なモデルスコアリングを可能にするシームレスなパイプラインを作れるのです。
今回のSnowparkとDataRobotのインテグレーションにより、AI実運用化の壁の解消はさらに容易になっていきます。
SnowflakeのシニアプロダクトマネージャーであるIsaac Kunenは、今回の統合について次のように述べています。
「Snowparkは、データインサイトをより多くの場面で手軽に活用いただけるように、また顧客が好みの環境でデータパイプラインを構築できるようにするために開発した多くの機能のうちのひとつです。SnowparkをDataRobotのエンタープライズAIプラットフォームと組み合わせることで、最先端の機械学習モデルを簡単にコーディングおよびデプロイできるようになりました。これは各々の企業が抱えているビジネス課題の解決に必ず役立つものだと考えています」
2018年以来、DataRobotとSnowflakeは共に、高度なエンドツーエンドのエンタープライズAIとクラウドデータインサイトの機能を双方の顧客に提供してきました。先日も、DataRobotの特微量探索機能がSnowflakeユーザー向けに導入されたばかりです。こうしたDataRobotとSnowflakeの機能を活用し、AIプロジェクトへの投資やその価値を最大化している企業のひとつがHarmoneyです。
Harmoneyでデータサイエンス部門の責任者を務めるAndrew Cathie氏は、次のように述べています。
「SnowflakeとDataRobotは、私たちのチームが強力なデータインサイトを収集してAI予測を作成し、それをより良い顧客体験につなげるために不可欠な存在です。Snowflakeなら、半構造化データと構造化データ、両方の集計や分析も容易です。そしてそのデータをDataRobotのプラットフォームに流し込めば、自社のニーズに最適な機械学習モデルが構築できるようになっています。この組み合わせはまさにベスト・オブ・ブリードで、両方のプラットフォームのシームレスな活用がビジネスに大いに役立っています」
DataRobotのプロダクト担当上級副社長であるNenshad Bardoliwallaは次のようにコメントしています。
「SnowflakeとDataRobotのパートナーシップがデータとAIの他にはないシナジーを生み、お客様のさらなる価値創出に貢献できることを誇らしく思います。Snowparkとの業界トップクラスのインテグレーションにより、AIモデルをSnowflakeのデータクラウドに直接デプロイいただけるようになり、DataRobotが持つ拡張知能の力が及ぶ範囲をビジネスに不可欠なデータにまで広げることができました。今後もSnowflakeと共に、DataRobotはAIプロダクションのギャップ解消を実現してまいります」
■「DataRobot, Inc.」について(製品詳細URL:https://www.datarobot.com/jp/)
DataRobot は、エンタープライズ AI のリーダーであり、AI イノベーションを競うグローバル企業に信頼できる AI テクノロジーとイネーブルメントサービス(継続的な AI サクセス支援)を提供しています。 DataRobot が提供するエンタープライズ AI プラットフォームは、機械学習モデルの構築、デプロイ、管理までをエンドツーエンドで自動化することで、実ビジネスにおけるデータサイエンスの民主化を実現します。このプラットフォームは、AI をお客様に大規模に提供し、そのパフォーマンスを長期にわたって継続的に最適化することで、お客様のビジネス価値の最大化を実現します。業界最先端のソフトウェアと世界水準の AI 実装、トレーニング、サポート、AI サクセスサービスから得られたノウハウの組み合わせにより、事業や組織の規模、業界、業種に関係なく、あらゆるお客様の実ビジネスにおける成果の実現を強力にサポートします。
Forbes が選ぶ2020年の「クラウド100(世界の優良非公開クラウド企業100社)」、2019年および2020年の「AI 50(最も有望なAI企業50社)」にも選出され、IDC のレポート「IDC MarketScape: Worldwide Advanced Machine Learning Software Platforms Vendor Assessment(IDC MarketScape:世界の高度機械学習ソフトウェアプラットフォームベンダー評価)」では、リーダーに選ばれました。詳細については www.datarobot.com をご覧ください。
■ 商標関連
・「DataRobot」はDataRobot, Inc.の登録商標です。
・その他の会社名、製品名、サービス名等は、各社の登録商標または商標です。
本リリースは、6月9日に米国で発表したニュースリリース(https://www.datarobot.com/news/press/datarobot-delivers-scalable-inference-with-snowflake-snowpark/)の抄訳版です。