このページの本文へ

前へ 1 2 3 4 次へ

今年もビルダーを魅了!AWS re:Invent 2019レポート 第3回

「AQUA for Redshift」などデータレイク/アナリティクス領域でも新発表が続々

Redshiftは他社の3倍、そして10倍高速に―AWSジャシーCEO基調講演

2019年12月16日 07時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

アナリティクス:Redshift専用ストレージにカスタムチップを搭載し高速化へ

 さらにジャシー氏は、来年(2020年)中旬の一般提供開始を予定している「AQUA(Advanced Query Accelerator) for Amazon Redshift」も発表した(現在はプレビューリリース)。すでにRA3において他社クラウドDWH比で「3倍」のクエリ速度を実現したが、AQUAの投入によってさらに「最大10倍」にまで引き離すと豪語する。

 AQUAとはどんなものか。Redshiftのサイトでは「ハードウェアにより高速化された新しい分散型キャッシュ」と説明されている。また基調講演での発表スライドでも、CPUとは独立した「Custom Analytics Processors」のボードが描かれている。ただしこれだけではよくわからない。

「AQUA(Advanced Query Accelerator) for Amazon Redshift」を発表

 ジャシー氏はAQUA開発の背景について、まず2012年以降のコンピュートとストレージそれぞれのスループット向上スピードから話を始めた。その間、コンピュートのスループット(CPUとDRAM間のスループット)は2倍にしかなっていないが、ストレージのスループットは12倍も高速化している。「かつてはストレージがボトルネックだったが、現在はコンピュートのほうがボトルネックになっている」(ジャシー氏)。

 そこでコンピュートノードをクラスタ化し、処理を並列化させるアイデアが生まれる。この考え方は妥当だが、クエリパフォーマンス向上を求めてコンピュートクラスタをさらにスケールアウトさせていくと、今度はコンピュートクラスタとストレージとの間でデータを転送するネットワークが飽和し、やがてパフォーマンスは頭打ちになる。

 大規模なDWH環境におけるこの課題を解決するために、従来のアーキテクチャを根本的に見直し、コンピュートクラスタとストレージの間にRedshiftの処理を最適化する新たなレイヤーを設ける。これがAQUA(AQUAレイヤー)だ。

 AQUAではまず、コンピュート処理の一部をAQUAレイヤーにオフロードする。具体的には、ストレージノード内にAWS独自設計のチップやFPGA(前述のCustom Analytics Processorsボード)を追加し、データ暗号化や圧縮、さらにフィルタリング、アグリゲーションといったクエリ処理の一部もここで実行する。コンピュートクラスタに転送されるのは、AQUAで“下処理”済みのデータだ。

 さらに、AQUAノードはスケールアウトアーキテクチャを採用しており、大規模なデータを処理する場合には、自動的にスケールして並列処理を行う仕組みだ。そしてAQUAはキャッシュなので、処理対象のソースデータそのものはS3ストレージから移動させない。つまり従来のように、コンピュートクラスタにすべてのデータを取り込む(ロードする)処理を行わない。

 こうした最適化を行うことで、Redshiftにおいてコンピュートノードやネットワークの負荷を軽減し、従来のボトルネックを解消してより高速かつ大規模なDWH処理を実現可能にするのが、AQUAの狙いである。

AQUAのアーキテクチャ図(公式サイトより)。コンピュートノードとストレージの間に、スケールアウトするAQUAレイヤーを設ける。このレイヤーにデータ処理とクエリ処理の一部をオフロード、並列処理させることで高速化を実現する

 もうひとつ重要なことは、AQUAがRedshiftの中で透過的に処理を行う点だろう。したがってAQUAを利用する場合でも、ユーザーは従来とまったく同じ手法でRedshiftを利用できるという。

 「一般には『新しいものが輝くのは最初だけ』と言われるが、われわれはRedshiftもS3もずっと進化させ続けている」(ジャシー氏)

* * *

 同基調講演ではこのほか、機械学習をユーザーフレンドリーなものにする「Amazon SageMaker」においても大量の新発表が行われた。引き続き稿をあらためてお伝えする。

前へ 1 2 3 4 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  6. 6位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  9. 9位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

  10. 10位

    TECH

    合成ゴムが及ばない天然ゴムの高性能のメカニズムを、現象発見から100年後に解明

集計期間:
2026年04月09日~2026年04月15日
  • 角川アスキー総合研究所