AWSがデータアナリスティックサービスの最新動向を披露
Amazon Redshift Serverless提供開始 モダンデータストラテジーを支援
2022年07月13日 15時00分更新
2022年7月13日、Amazon Web Servicesは昨年のAWS re:Inventでプレビュー版として提供されてきた「Amazon Redshift Serverless」の一般提供を開始した。データアナリスティックサービスのサーバーレス化により、現場の担当者がデータ分析に専念できる環境を実現する。
発表から10年を迎え、進化を続ける元祖クラウド形DWH
クラウド型のDWH(Dataware House)サービスのAmazon Redshiftは、オンプレミスでは実現が難しい高いコストパフォーマンスを売りとする。ゲーム、金融、制約、エンタメ、Webなどさまざまな業界において、万単位ユーザーが、エクサバイト単位のデータを分析しているという。
Redshiftは2012年の発表以来、新機能を追加し、ML(Machine Learning)や他のサービスとの連携も強化している。たとえば、RA3ノードとマネージドストレージとの組み合わせることで、コンピューティングとストレージをそれぞれ個別にスケールすることが可能になっている。また、Redshiftクラスター間でライブデータを一貫性を持って共有できる「Amazon Redshift Data Sharing」、サードパーティのデータをETLなしでインテグレーションできる「Amazon Data Exchange for Amazon Redshift」などの機能も追加されている。
さらに現在では機械学習のテクノロジーを活用した最適化によって、人手によるチューニングも最小限に抑えることができる。需要の高いショートクエリのスループットも改善しており、他社に比べて最大8倍のスループットを発揮。手動チューニングや特別な設定なしで、自動チューニング任せた場合のベンチマークでも、他社製品に比べて高いコストパフォーマンスを実現するという。
データウェアハウスからの解放を謳うRedshift Serverless
今回一般提供が発表されたAmazon Redshift Serverlessは、文字通りRedshiftのサーバーレス版。データウェアハウスからの管理からの解放を謳い、リソースのプロビジョニング、スケーリング、パッチ適用、フェールオーバー、バックアップなどインフラの管理はすべてAmazon側が担当し、「わずか数秒でデータから洞察を得られる」という。従来のプロビジョンドクラスターと同じ機能が提供されており、SQLの実行や組織内でのデータの共有、さまざまなツールやアプリケーションからの接続も可能となっている。
発表会では医療サービスで活用するNextGen Healthcare、運行の最適化を進める鉄道会社のRail Delivery Group、分析に活用しているHuron Consulting CroupなどのRedshift事例も披露。インフラ管理からの解放、使用した分だけの支払い、高いコストパフォーマンスなどに評価を得られたという。
AWSはApache SparkやHiveなどのワークロードを実行できる「Amazon EMR Serverless」やApache Kafkaとの互換性を持つ「Amazon MSK Serverless」、あらゆるデータのストリーミングに利用できる「Amazon Kinesis Data Streams On-Demand」など、サーバーレス製品を強化。これまで以上に運用管理の手間や負荷を軽減し、データに基づく意思決定を実現するモダンデータストラテジーでのデータ統合、モダナイズ、イノベイトを支えるという。