このページの本文へ

今年もビルダーを魅了!AWS re:Invent 2019レポート 第3回

「AQUA for Redshift」などデータレイク/アナリティクス領域でも新発表が続々

Redshiftは他社の3倍、そして10倍高速に―AWSジャシーCEO基調講演

2019年12月16日 07時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

データレイク:複数アプリのアクセスポリシー管理をシンプル化「S3 Access Points」

 データレイク領域について、ジャシー氏はまず、現在の企業は「かつては予想しなかったような」データの必要性に迫られていることを強調した。膨大な量のデータを、これまでにはないかたちで活用するためには、自社が保有するデータの分断状態=“データサイロ”を打破し、データレイクを実現しなければならない。そのためには、古いツールではなく新たなツールが必要だと語る。

 AWSでは、Amazon S3をデータレイクのソリューションと位置づけている。実際に多くの顧客が、高いスケーラビリティと可用性、汎用性、管理性(自動化機能)を持つデータレイクとして採用していると語る。さらにデータセキュリティについても、暗号化やS3バケットやユーザーアカウントレベルでのアクセス制限、さらに前日発表した「IAM Access Analyzer」による継続的なアクセス状況の監視といった機能を提供していると説明した。

 しかしデータレイクがより大規模化し、多くのデータセットが企業内で共有されるようになると、それぞれのデータに対してどのアプリケーションへのアクセスを許可するかというアクセスポリシーの管理が非常に複雑化することになる。そこでAWSは今回、新たに「Amazon S3 Access Points」という機能を発表した。同日より一般提供を開始している。

「Amazon S3 Access Points」を発表。共有データセットのアクセスポリシー管理をシンプル化する

 S3 Access Pointsは、単一のS3バケットに対して複数種類のアクセスポリシー(IAMポリシー)を設定可能にする機能だ。これまでは1つのS3バケットには単一のアクセスポリシーしか適用できなかったが、S3 Access Pointsを利用することで、異なるアクセスポリシーと固有のホスト名を持つ複数の“アクセス窓口”が用意できる。これにより、1つのデータセットを複数のアプリケーションで共有する場合の管理をシンプル化するとともに、セキュリティリスクを低減するという狙いだ。

S3 Access Pointsの設定画面(AWSブログより)

アナリティクス:S3データレイクの統合を進めるRedshiftの新機能

 データ分析、アナリティクスの領域では、2012年から提供しているデータウェアハウス(DWH)サービスのAmazon Redshiftを取り上げた。Redshiftは現在、数万社が利用しており、この1年間で100以上の機能改善を図ってきたとジャシー氏は説明する。

 Redshiftにおいて今回はまず、上述したS3データレイクとの統合をさらに強める2つの新機能を発表している。「Data Lake Export」と「Federated Query」だ。

 Data Lake Exportはその名のとおり、Redshift上のデータをS3データレイクにエクスポートするものだ。エクスポートデータの形式はデータ分析で標準的なApache Parquetフォーマットであり、Redshiftで処理済みのデータを、さらに他のサービスやアプリケーションで処理できる仕組みだ。リリースバージョン1.0.10480以降のRedshiftクラスタで利用できる。

 Federated Queryは、Redshiftクラスタ上のデータだけでなく、S3データレイク、Amazon RDS/Aurora for Postgres上にあるデータを直接、Redshiftからまとめてクエリをかけられる機能。公式ブログでの説明によると、Redshiftは外部のデータをインポートすることなく、RDS/Auroraのテーブル名などメタデータを読み取ってクエリ内容を書き換え、実行するという。こちらはプレビューリリースとなっている。

RedshiftとData Lake Export/Federated Query、さらに他のデータ関連サービスとの関係(公式ブログより)

 そのほかre:Inventの会期直前には、Redshiftにおけるマテリアライズドビュー(Materialized View)のサポートも発表している(プレビューリリース)。これはクエリ結果をキャッシュしておき、ソーステーブルに加えられた変更部分だけを追加で処理するビューを提供する仕組み。ダッシュボードやBIツールなどで繰り返し実行されるクエリのパフォーマンスを大幅に向上する。

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

アクセスランキング

  1. 1位

    TECH

    フォーティネットの「SSL-VPN廃止」 IPsec移行と脱VPN、それぞれの注意点を総ざらい

  2. 2位

    ソフトウェア・仮想化

    「SaaSの死」の影響は感じない ― グローバル以上に好調な日本市場、ServiceNow鈴木社長が語る

  3. 3位

    ネットワーク

    ネットワークとセキュリティの統合に強み 通信事業者系ZTNA/SASEサービス3選

  4. 4位

    TECH

    「蟻の一穴」となるリモートアクセスVPNの脆弱性 ZTNA/SASEはなぜ必要か?

  5. 5位

    デジタル

    海外駐在員の負担を軽減し、ワンチームへ kintoneは言語と文化の壁を越える「翻訳の魔法」

  6. 6位

    ビジネス

    医療費5兆円抑制につながる“国産ヘルスケア基盤”構築へ SMBC×富士通×ソフトバンクが業務連携

  7. 7位

    エンタープライズ

    基盤も古いし、コードも酷い! そんなクエストにGitHub Copilotで試行錯誤しまくった「みんな」こそ最高

  8. 8位

    サーバー・ストレージ

    「30%ではなく“30倍”の生産性向上へ」 AIエージェント時代に求められるIT基盤、マイケル・デル氏が語る

  9. 9位

    ビジネス・開発

    いますぐ捨てたいITサービスは? AI推しにそろそろ飽きてません? 情シスさんのホンネを「ゆるっとナイト」で聞いた

  10. 10位

    ITトピック

    AIセキュリティで必要な6つの対策/20代の半数が「検索エンジンを使わない」/生成AIツールはエンジニアの「業務インフラ」へ、ほか

集計期間:
2026年05月19日~2026年05月25日
  • 角川アスキー総合研究所