このページの本文へ

“DWHのパフォーマンス”と“データレイクの経済性”を実現する「レイクハウス」ビジョンを推進

データレイク上でDWH処理を、データブリックス「SQL Analytics」発表

2020年11月16日 07時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 クラウドネイティブな統合分析基盤を提供するデータブリックス(Databricks)は2020年11月13日、データレイク上でデータウェアハウス(DWH)ワークロードの実行を可能にする「SQL Analytics」の提供開始を発表した。これまで“分断”されていたデータレイクとDWHの世界を融合させる“レイクハウス(Lakehouse)”アーキテクチャのビジョンを実現し、さらに前進させていく方針。

「SQL Analytics」のクエリ画面(出典:データブリックスWebサイト)。使い慣れたSQL文やBIツールでデータレイクを探索できる

 データブリックスは、AI/マシンラーニングに特化したデータ分析基盤を提供する“データ&AI企業”。「Apache Spark」「MLflow」「Delta Lake」などで構成されるオープンソースソフトウェアベースの分析プラットフォームを、パブリッククラウド(AWS、Microsoft Azure)上のマネージドサービスとして提供している。今年9月には日本法人による本格的な国内展開開始も発表した。

 同社が提唱するレイクハウスアーキテクチャは、従来分断されていたデータレイクとDWHを融合させた単一のデータプラットフォームにより、すべてのデータ(構造化/半構造化/非構造化、ストリーミング)、すべてのユースケース(BI/レポーティング、機械学習/ディープラーニングなど)、すべてのユーザー(ビジネスアナリスト、データエンジニア/サイエンティスト、機械学習エンジニアなど)に対応するというビジョンだ。

 レイクハウスアーキテクチャの実現によって、企業内にあるデータのサイロ化を解消し、さまざまなユースケースのためのデータ処理プロセスをシンプル化/省力化するとともに、多様な解析言語への対応(SQL、R、Python、Scala、Java)によって異なる職種のユーザー間コラボレーションも容易にする。さらに単一プラットフォームに格納することで、膨大な量/種類のデータに対するガバナンスも実現できる。

すべてのデータ/ユースケース/ユーザーに対応するレイクハウスアーキテクチャによって、同社ビジョンである「データとAIの民主化」の推進を図る

レイクハウスアーキテクチャは、従来“分断”されていたDWHとデータレイクの世界を融合させたもの

 今回発表されたSQL Analyticsは、顧客の保有する既存のデータレイク(HDFS、AWS S3など)にデータブリックスの「Delta Lake」による抽象化レイヤーを付加し、さらに独自のクエリ実行エンジン「Delta Engine」を用いることで、コピーデータなどを用意することなくデータレイク上のDelta Lakeテーブルに直接クエリを実行し、BIワークフローに求められる分析パフォーマンスを実現するもの。

 このDelta Lakeにより、ACIDトランザクション、バッチ/ストリーミングなどに対応するほか、データのバージョン管理(スナップショット)機能も備え、信頼性が確保される。また、Delta Engineは「Apache Spark」と完全互換のクエリエンジンで、分散並列処理により高速にクエリを完了させる。

データレイクの抽象化レイヤー「Delta Lake」と、分散クエリエンジン「Delta Engine」の概要

 SQL Analyticsは「Tableau」や「Qlik」「Power BI」といった主要BIツール用のコネクタを用意しているため、ユーザーは既存のBIワークフローを統合してデータ分析を実行することができる。またSQLクエリやビジュアライズのWebインタフェースも備えており、BIツールを使っていないアナリストやデータサイエンティスト、開発者でも容易にダッシュボードやレポートを作成できる。

GUIによるデータのビジュアライズ/ダッシュボード機能も備える(出典:データブリックスWebサイト

 データブリックスでは、こうした仕組みによって“DWHのパフォーマンス”と“データレイクの経済性”を両立させ、一般的なクラウドDWHと比べて「最大8倍の価格性能」を実現できると述べている。SQL Analyticsは、11月18日よりパブリックプレビューとして公開される。

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    ネットワーク

    「ケーブルを引っ張ってみてください。」→引っ張ってみた結果……

  2. 2位

    ネットワーク

    量子コンピューターを超える!? 「光量子コンピューター」ってのがあるんです。

  3. 3位

    ネットワーク

    マザーボードが油に沈んでる!? SFみたいな“液浸冷却システム”、見た目からして未来すぎる

  4. 4位

    トピックス

    “スター・ウォーズのホログラム”が現実に近づいた? 幕張で見つけた裸眼3Dディスプレイが未来すぎる

  5. 5位

    ネットワーク

    データセンター不足の救世主になるか? “コンテナ型サーバー”が想像以上にすごい

  6. 6位

    ネットワーク

    キオクシアって結局なに作ってるの? 「株価急騰の注目企業」を幕張で見てきた

  7. 7位

    TECH

    Claude CodeのPlan modeをやめてみる ~grill-meスキルで一歩ずつ設計を固め、アプリを作る~

  8. 8位

    ITトピック

    VMware利用企業、8割近くが「他環境へ移行検討・実施」/データセンター電力消費が1年で26%増加、AI競争で「電力確保」重要課題に、ほか

  9. 9位

    ネットワーク

    「手のひらネットワーク機器」第4弾が登場、テーマは“ShowNetを手のひらに”! こだわりの両面マウントや高密度ポートも 6月11日発売

  10. 10位

    ネットワーク

    サーバーの水冷ぜんぶ見せる大作戦! レノボが見せた“AI時代の冷却”が迫力ありすぎる

集計期間:
2026年06月09日~2026年06月15日
  • 角川アスキー総合研究所