データ主権要件への対応にも適する「Oracle Globally Distributed Autonomous DB」
オラクル、「Autonomous DB」ベースのグローバル分散DBを提供開始
2024年03月05日 16時30分更新
オラクルは2024年3月4日(米国時間)、シャーディング技術に基づくデータベース(DB)のグローバル分散に対応した「Oracle Globally Distributed Autonomous Database(以下、GDADB)」の提供開始を発表した。「Oracle Autonomous Database」をベースに、設定されたポリシーに沿ったデータ分散配置の自動化も実現することで、ミッションクリティカル要件に加えて、各国/地域で規制強化が進むデータ主権(データソブリンティ)要件への対応が簡素化できるとしている。
記者説明会に出席した米オラクル SVPのウェイ・フー氏は、これまでの分散DBのユースケースや運用管理の課題を説明したうえで、Oracle GDADBによる課題解決や他社分散DBサービスと比較した場合の優位性などを紹介した。
分散DBのメリットは「処理性能と耐障害性の向上」「データ主権規制への対応」
Oracle GDADBは、オラクルがこれまで提供してきた分散DB「Oracle Globally Distributed DB」で培われた技術を、Oracle Autonomous DBに適用したものとなる。
Globally Distributed DBでは、物理的に複数の場所/DBインスタンス(シャード)に分散配置されたDBを、論理的に1つに統合して扱うことができる。アプリケーションからのリクエスト(クエリ)は自動的に分割されて、そのデータを持つ適切なシャードが処理する。このように透過的に扱えるため、単一DB環境から移行してもアプリケーション改修の必要はない。
フー氏は、オラクルではもともと「Oracle RAC」のスケールアウトクラスタ向けに、並列処理が実行できるSQLエンジンを持っており、これはGlobally Distributed DBの分散スケールアウト環境においても有効活用できると説明した。他社では分散DB環境をNoSQLベースで実現しているケースもあるが、パフォーマンス面でSQLベースのオラクルに強みがあるとする。
そして、Globally Distributed DBを利用する主な目的は「2つある」とフー氏は説明する。
ひとつは、シャードのレプリケーション(冗長化)によるパフォーマンスと耐障害性の向上だ。複数のシャードに格納されたデータに対するクエリは、それぞれのシャードで分散並列処理されることになるため、スケールアウトによって大規模データのクエリパフォーマンス向上が期待できる。また、あるシャードがダウンしても、レプリケーションされた別のシャードが処理を継続することで、耐障害性も高まる。
そしてもうひとつが、データ主権要件への対応だ。近年では、さまざまな国/地域や業界でデータ主権をめぐる規制が強まっており、データ/DBを配置する「場所」に大きな制限がかかるようになっている。だが、ここにGlobally Distributed DBを適用すれば、データ(シャード)は物理的に各国(主権国)に配置して要件に対応したうえで、グローバルをカバーする単一DBとして使えることになる。
そうしたGlobally Distributed DBのユースケースとして、フー氏は2つの導入事例を紹介した。
ひとつは「Oracle BlueKai Data Management Platform(DMP)」における、パフォーマンス向上の事例だ。ユーザーのネット行動を記録した数PBクラスのデータベースを持つBlueKaiでは、パフォーマンス向上のためにDistributed DBへのマイグレーションを実施。3つのデータセンターをまたぐかたちで単一の論理DBを構成しているが、発生する秒間100万トランザクション、1日に300億のAPIコールを、平均1.6ミリ秒のレスポンスタイムで処理することができている。
もうひとつは米国の大手銀行における、インドで制定されたデータ主権ルールへの対応だ。同行では、すべての国の取引データを、米国内に配置した「Oracle Exadata」で一元管理していた。しかし、2018年にインドで制定された業界規制により、インド国内どうしの銀行取引データはインドに保管することが必要となった。そこで同行ではGlobally Distributed DBを採用し、インドに新たなシャードを配置して、インド国内の取引をそこで管理することとした。こうしたDBの構成変更を行っても、複雑なアプリケーションティアにはほぼ変更を加える必要がなかったという。
Autonomous DBと組み合わせ、データ分散やシャード管理の自動化/自律化
ただし、こうした分散DB環境は複雑な構成になりがちで、運用管理作業には大きな手間がかかっていた。そこで、Autonomous DBの技術と組み合わせることで管理の自律化/自動化と簡素化を図ったのが、今回提供開始したOracle GDADBとなる。
Autonomous DBでは、AI/機械学習技術を適用してDBのプロビジョニングやチューニングなどの管理作業を自動化/簡素化しているが、これがGDADBのデータ分散やシャード管理の自動化にも適用されることになる。
フー氏は他社の分散DBサービスと比較した強みについて、前述したOracle RACの分散DBに対応したSQLエンジンに加えて、他社よりも「データの分散手法」と「シャードのレプリケーション手法」、そして「シャードのデプロイ手法」の選択肢が豊富に用意されていることを挙げた。これらの特徴によって、データを利用するアプリケーションと近い場所にシャードを配置することができ、また別リージョンなどシャードどうしが遠く離れていても確実なレプリケーションが可能となる。
なおGDADBは、「Oracle Cloud Infrastructure(OCI)」パブリックリージョンだけでなく、マルチクラウド環境、顧客データセンター内に設置された「Oracle Exadata Cloud@Customer」や「OCI Dedicated Region」、Oracle RACクラスタにも展開が可能だ。
そのほかにもフー氏は、“コンバージドDB”としてさまざまなデータモデルに一元対応していること、生成AI/LLMを用いた「Autonomous DB Select AI」によって自然言語で問い合わせ(クエリ生成)ができること、生成AIのRAGにも対応するベクトルDBの機能を有すること、といったOracle DBの強みが、GDADBでも継承されていることを紹介した。