Microsoft Build 2022 Spotlight on Japan完全レポート 第10回
「Build 2022」の最新発表、Azure SQL、Cosmos DB、Synapse Analytics、Azure Databricksまで
ハイブリッド/マルチクラウドへ、進化するAzureのデータ&分析サービス
2022年06月27日 11時00分更新
現在では「データの利活用」がクラウド採用の重要な動機となっている。だが、実際の利活用ニーズは多様であり、そこで求められる機能も多岐にわたる。こうしたユーザーの動きを先取りするかのように、Microsoft Azureではデータ&分析サービスが急速な進化を続けている。
2022年5月25日に開催された「Microsoft Build 2022 Spotlight on Japan」のセッション、「Azure データ&分析サービス 最新アップデート」では、日本マイクロソフトのクラウドソリューションアーキテクトである中里 浩之氏が、Microsoft Azureにおけるデータと分析のサービスを説明するとともに、最新アップデートを紹介した。
マイクロソフトはこの分野で、データベース、分析、ガバナンスの3つを軸としたサービスを展開している。具体的に注力しているのは「オープンソース」「パフォーマンス&スケール」「ハイブリッド&マルチクラウド」「セキュリティ」「インテリジェンス」だ。中里氏は、このうち「Build 2022で特に注目したいのは『ハイブリッド&マルチクラウド』」と話す。
SQL Server 2022はパブリックプレビューに移行
Microsoft Azureにおける中核的なデータベース関連サービスの1つに「Azure SQLファミリー」がある。一貫性のある共通のSQL Serverエンジンを、Azureによる一元管理の下で、クラウドからエッジまでさまざまな場所で動かすことができる。
最新のSQL Serverエンジン「SQL Server 2022」は、2021年11月にプライベートプレビューが発表されていたが、今回パブリックプレビューに移行した。SQL Server 2022では、主に以下のような新機能/機能強化点がある。
・「Azure SQL Managed Instance」のリンク機能により、オンプレミスや他のクラウドで動いているSQL ServerのDR(災害対策)サイトを、Azure上に容易に構築できるようになった。オンプレミスのSQL Serverの読み取り負荷を、Azure上のSQL Managed Instanceにオフロードすることもできる。
・「Azure Synapse Link for SQL Server」で、SQL Serverのデータをほぼリアルタイムに同期し、オンライントランザクション処理に影響を与えることなく最新のデータを分析できる。
・「Microsoft Purview」との統合で、新たにアクセス権の集中的な設定・制御ができるようになった。
・「SQL Server Ledger」では、SQL Serverによる中央管理の下で、ブロックチェーン技術を使ってデータの整合性を保証できる。
・「Azure SQL Database Ledger」は、この台帳機能をいち早くAzure上でパブリックプレビューとして提供していたが、今回 GA(一般提供開始)が発表された。
またAzure Arcでは、Azure SQLを外部のKubernetesクラスターで実行できる「Azure Arc-enabled SQL Managed Instance」において、インスタンスのCPUコア数やメモリ容量に制限がない「Business Critical」サービスレベルがGAとなった。
一方、OSSのデータベースのPostgreSQLやMySQLをAzure上で活用できる「Azure Database for PostgreSQL/MySQL」では、デプロイオプションが拡大している。
2021年11月にGAとなった新たなデプロイオプション「フレキシブル サーバー」では、これらのデータベースを、データベース管理機能と構成設定のよりきめ細かな制御と柔軟性を提供するフル マネージドデータベースサービスとして利用できるようになった。マイクロソフトは、新たに開発したり移行したりするケースでは、豊富な機能を持つフレキシブル サーバーの利用を推奨しているという。
あらゆるスケールに対応する、オープンなAPIを備えた高速なNoSQLデータベース「Azure Cosmos DB」については、2022年4月のアップデートで、自動スケールにおける最小範囲(RU:Request Units)の下限値が従来の4分の1(100RU/秒)まで引き下げられ、自動スケールがより安価に使えるようになった。
今回のBuild 2022では、合計9つのアップデートが公開されている。「バースト容量」(プレビュー)は、データベースまたはコンテナーのアイドル容量を利用して、トラフィックの急増を処理できるというものだ。バースト容量では、各物理パーティションで最大5分のアイドル容量を蓄積でき、最大3000RU/秒のレートで消費できる。たとえば物理パーティションの容量を100RU/秒に設定した場合、アイドル容量は最大で3万RUぶん蓄積され、バースト時に3000RU/秒で10秒間使用できるといった具合だ。なお、Cosmos DBのサーバーレスモードにも改善が施され、コンテナーあたりの最大ストレージが50GBから1TBに拡大された(プレビュー)。
Synapse Analyticsは、オンプレミスを含めた統合分析基盤としての機能が充実
分析関連で中里氏が最初に取り上げたのは「Azure Synapse Analytics」。これは、エンド・ツー・エンドの分析のための統合クラウドネイティブプラットフォームだ。
「オンプレミス、クラウドなどさまざまなデータを集約し、Synapse Studioという専用のUIで集中的に分析できる。さらにPurviewなど、Azureの他のサービスとの連携も特徴だ」(中里氏)
分析ランタイムは4種類をラインアップしている。
・専用SQL。従来のAzure SQL Data Warehouseと同等の、ハイパフォーマンスなデータ分析機能を備える。
・サーバーレスSQL。これは主にAzure Data Lake Storage上にあるデータを探索的に分析するためのサービス 。データ処理量に応じた従量課金が特徴。
・Synapse上での Apache Spark。これにより大規模なデータのデータエンジニアリング と機械学習が行える。Sparkのノートブックから、数クリックで Azure Cognitive Serviceを呼び出すセットアップができる。
・Azure Data Explorer。この機能を、Synapseの中でも利用できるようになった(プレビュー)。大量のログやIoTデータをリアルタイムで分析できる。
Synapse Analyticsでは、2022年4月に「レイクデータベース」がGAとなった。データレイクに構造化されたデータモデルを定義でき、これに対してサーバーレスSQLとSparkでクエリをかけることができる。さらにレイクデータベースでは、各業界でよく使われる18以上のデータベーステンプレートを展開できる。
拡大するSynapse Link、ETL不要でほぼリアルタイムな分析が可能
Azure Synapse Linkは、オペレーショナルデータをETLなしで、ほぼリアルタイムに分析できるSynapse Analyticsの機能だ。現在はCosmos DB、Dataverse、SQL Server、Azure SQL Databaseの4つのデータストアをサポートしている。
まず2020年に発表され、GAとなっている「Synapse Link for Cosmos DB」。Cosmos DBのデータは、トランザクションデータの読み書きに最適化された行指向のデータストア(「トランザクションストア」)に格納される。Synapse Linkを有効化すると、トランザクションストアのデータが分析に最適化された列指向のデータストア(「分析ストア」)へ、通常2分以内のラグで自動的に同期されるという。こうした処理済みのデータストアに対して、SparkやサーバーレスSQLからアクセスし、機械学習やビッグデータ分析が行える。
トランザクションストアと分析ストアはパフォーマンスの分離が保証されている。つまり、ヘビーな分析を行ってもCosmos DBのトランザクション性能に影響はない。
Synapse Linkを有効化できるコンテナーは、これまで新規に作成するSQL APIコンテナー、MongoDB APIコンテナーに限られていたが、2022年3月に既存のSQL APIコンテナーへの対応がGAとなった。
また「Synapse Link for Dataverse」は2021年11月にGAとなった。DataverseはPower AppsやDynamics 365におけるメインのデータストアである。Power PlatformでこのSynapse Linkを有効化すると、DataverseのデータがAzure Data Lake Storageに、メタデータがSynapseに自動的に連携される。データ加工パイプラインをユーザー自身で構築したり、管理したりする必要はない。
今回パブリックプレビューとなったのが「Synapse Link for Microsoft SQL」だ。これは、Azure SQLのデータに対しても、データ加工なしにほぼリアルタイムでデータを分析したいという多くの要望に答えたもの。Synapse Link for Microsoft SQLでは、SQL Server 2022とAzure SQL Databaseに、Synapse Linkの機能が適用できる。これにより、オンプレミスや他のクラウドで稼働するSQL Serverのデータを、Synapseに簡単に統合できる。
レイクハウスのAzure Databricksで、分析がさらに容易に
近年注目が集まっているデータ関連のトレンドに「レイクハウス」がある。データレイクの経済性とデータウェアハウスの処理性能を両立させるという動きだ。
このレイクハウスプラットフォームを実現しているのが「Azure Databricks」。Apache Sparkベースのフルマネージドサービスで、あらゆるデータを集約し、Delta LakeやApache Parquetなどの分析に最適な形式で保持する。これにより、データエンジニアリング、データサイエンスおよび機械学習、データアナリティクスといった用途をカバーする。
Databricksの新機能のうち、中里氏はDatabricks SQLとDelta Live Tablesを紹介した。
Databricks SQLはクラウドストレージ上のデータを標準的なSQLで分析できる。そして、これをOSSのデータ可視化ツールRedashベースのUIで可視化できる。2021年12月にGAとなった。
一方、2022年4月にGAとなったDelta Live Tablesは、データ処理パイプラインを構築するためのフレームワーク。SQLとPythonで、ストリーミングやバッチのパイプラインを簡単に構築できる。
Delta Live Tablesの重要な特徴に、インフラの自動管理がある。
「ユーザーがクラスターのインスタンスの最大と最小を設定すると、クラスターの負荷に合わせて自動的にスケールする。ユーザーはインフラの管理ではなく、データの変換に集中できる」(中里氏)
Purviewはポリシー機能の強化でデータ権限管理の統合進める
Azureにおけるガバナンスといえば「Purview」だ。「Azure Purview」は2022年4月、「Microsoft 365 Compliance」を統合して「Microsoft Purview」に改称された。これにより、統合データガバナンスの機能はそのままに、リスク&コンプライアンス機能が加わった。
中里氏は、Microsoft Purviewの新しい機能であるポリシー(プレビュー)について紹介した。
例えば複数のSQL Serverを運用していて、ユーザーに読み取り権限を与えたいとする。これまではそれぞれのデータストアに対して別個に権限を付与する必要があった。
だが、Purviewのポリシーを使えば、アクセス権限を集中的に管理できる。まず、データストア、リソースグループ、サブスクリプションをPurviewに登録する際に、「データ使用管理」を有効化することで、アクセス制御をPurviewに委任できる。次に、「誰に」「何の操作を」「どのデータに対して」行わせたいかを、ポリシーステートメントとして指定する。
ポリシーの適用対象のデータストアは、これまでAzure Blob Storage、Azure Data Lake Storage Gen 2に限定されてきたが、新たにSQL Server 2022が加わる。Azure SQL Database、Azure Cosmos DBにも対応予定という。
今後、Purviewのポリシー機能はさらに進化する。例えばAzure AD のユーザーとグループに、Azure SQL ファミリーと Cosmos DB のデータ読み取りをまとめて許可する、といったことが可能になる。
* * *
上記のように、Azureのデータ関連サービスでは多岐にわたる機能強化、機能拡張が進行中だ。中里氏は「Build 2022におけるデータセッションの中核テーマは、ハイブリッドおよびマルチクラウド機能を備えた、信頼できる統合されたデータ プラットフォームで、イノベーションを高速化し、俊敏性(アジリティ)を実現すること」と述べ、セッションを締めくくった。
(提供:日本マイクロソフト)
この連載の記事
-
第12回
sponsored
Buildで感じたマイクロソフトの強みは「歴史」と「包容力」 -
第11回
sponsored
マイクロソフトは「AIの可能性」と「責任あるAI」の両立を支援 -
第9回
sponsored
クラウドネイティブや組織文化の転換はハッカソンで実践できる -
第8回
sponsored
増えるローコード開発需要に応える「Power Pages」と「Express Design」を発表 -
第7回
sponsored
マイクロソフトとGitHubが実現し、進化させるDevSecOpsの姿 -
第6回
sponsored
開発者どうしのつながりを生んだBuild 2022「Connection Zone」参加リポート -
第5回
sponsored
SoE/SoR/SoIと全社レベルのデータストア整備をPaaSの閉塞化で実現したBIPROGY -
第4回
sponsored
「Azure Container Apps」はGAに、クラウドネイティブなアプリ開発を強力支援 -
第3回
sponsored
Build 2022で最新版Windows App SDK 1.1を発表 -
第2回
sponsored
CTCのID連携サービス「SELMID」を支えるAzure ADのテクノロジー - この連載の一覧へ