このページの本文へ

前へ 1 2 次へ

ヘルスケア業界向けのデータレイク「Amazon HealthLake」を発表

ビルダーに機械学習を拡大 DBエンジニアや産業用途、ヘルスケアでも

2020年12月16日 10時30分更新

文● 大谷イビサ 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 12月9日に行なわれたAWSのAmazon Machine Learning担当バイス・プレジデントのスワミ・シバスブラマニアン(Swami Sivasubramanian)氏による機械学習(ML)フォーカスの基調講演。後半は多くのビルダーに機械学習を拡大するためのAWSの戦略やサービスについて披露した。

AWS Amazon Machine Learning担当バイス・プレジデントのスワミ・シバスブラマニアン(Swami Sivasubramanian)氏

いいアイデアは組織のどこでも起こりえるもの

 今回のAWS re:Invent期間中に発表されたSageMakerのアップデートや新機能は、おおむね機械学習のプロ向けと呼べるもの。ここでいうプロとはデータサイエンティストを指しているが、日本はもとより北米でもまだまだMLの専門家は多くない。シバスブラマニアン氏は、「SageMakerのようなツールを使えば、さまざまなユーザーがMLモデルの開発ができる。多くの人たちはスキルがなかったり、時間がなく、モデルを作れない。でも、いいアイデアというのは、組織のどこでも起こりうるもの」と指摘。より多くのビルダーに機械学習を拡げていくというサービスの方向性を明示した。

 たとえば、SageMaker AutoPilotは機械学習モデルを自動生成してくれるサービス。スキルと知識の必要な手動での構築と、モデルの作成方法を把握できない代わりに自動化されたAutoMLのギャップを埋めるべく、表形式のデータセットから予測する列を探し、自動的にモデルを生成。リコメンドから最適なモデルを選べるほか、モデルのノートブックの可視性とコントロールも得ることができる。

 基調講演では言及されなかったが、新サービスである「Amazon SageMaker JumpStart」も機械学習の敷居を下げる取り組みの1つだ。不正検知や予防保全、需要予測など15を超えるユースケース向けにソリューションを提供し、数クリックでデプロイまで可能になっている。カスタマイズも可能で、PyTorchやTensorFlowで公開されている学習済みモデルもデプロイできるという。

Amazon Redshft ML発表 DB開発者にもMLを

 同じデータを扱っていても、機械学習を利用するのはML専門家が中心で、データベースの開発者やデータアナリストにとってはまだまだ敷居が高い。また、機械学習をアプリケーションに組み込むためには複雑で手間がかかった。MLモデルを作り、データベースからこのモデルを読み込むためのアプリケーションコードを書き、MLモデル用にデータをフォーマットし、MLサービスを呼び出し、結果のデータもアプリケーションのためにフォーマットする必要がある。複数のデータベースになると、このフローはもっと複雑になる。

アプリケーションに機械学習を組み込む複雑なフロー

 こうした負荷の重い作業を減らすべく、AWSは既存のデータベースやツールに機械学習を組み込み、直接扱えるようにしている。昨年発表された「Aurora ML」ではSQLクエリからMLサービスを呼び出し、結果をアプリケーションに返すことができる。また「Athena ML」も同じで、S3に対してのSQLクエリで不審なログインや売り上げ予測などMLモデルを利用できる。

 今回発表された「Amazon Redshift ML」はRedshiftのデータウェアハウスからSQLでデータを引き出し、MLモデルを生成する。SQLでセレクトされたデータはRedshiftからS3に移され、セキュリティを保った形でAutoPilotが処理を引き継ぐ。あとはデータのクレンジングや事前準備などを経て、MLモデルを生成し、最適なアルゴリズムを当てる。「ここまでのやりとりはすべて自動化されている。トレーニングされたモデルは、SQLの関数として提供され、Redshift内に格納される。レポートをダッシュボードで使うことができる」とシバスブラマニアン氏は語る。

 また、あわせて「Amazon Neptune ML」も発表された。複雑な関係性をデータとグラフモデルで表現する最適なグラフ型データベースであるNeptuneは、ナレッジグラフや遺伝子や疾患の情報管理、不正検知、レコメンデーションエンジンなどに使われている。Neptune MLはグラフデータを選択し、MLモデルを自動選定してくれるので、精度の高い予測が可能になる。「既存のMLテクニックより、50%も精度が改善される」(シバスブラマニアン氏)と語る。なお、SageMaker AutopilotはDOMO、SISENCE、Qlik、Tableau、Snowflakeなどサードパーティとの連携が予定されているという。

MLの知識がないユーザーでも使えるQuickSight Q

 AWS自体もQuickSightを強化しており、今回は自然言語での検索が可能なQuick Sight Qという新機能も投入されている。AWS BI&アナリスティック VPのドロシー・リー氏は、「QuickSight Qは最新の機械学習と自然言語の技術を使っている。通常の言語で問い合わせをして、すぐに答えを得ることができる」とアピールする。

AWS BI&アナリスティック VP ドロシー・リー氏

 ダッシュボード化されている情報以外を見たい場合、今まではBIチームに調べたい内容をBIチームにリクエストし、数日待たなければいけなかったが、QuickSight Qであれば迅速に洞察を得ることができる。社内や部門で利用されている用語も学習するため、普段の通り「カリフォルニアとニューヨークの1週間の利益の比較」とか、「今年、カリフォルニアでもっとも売れた商品」といった質問を問い合わせればよい。

 QuickSight Qで既存のデータを取り込むと、自動的にナレッジレイヤーを生成し、意味とデータの関係性を示すことができる。リー氏は、さまざまなデータセットを選択でき、すぐに始められ、しかも継続的にモデルを改善できるとアピールした。

 MLの知識がなくても、MLの恩恵を受けられるサービスはQuickSight以外にも数多く投入されている。コンタクトセンターサービスの「Amazon Connect」では、顧客との音声でのやりとりを文字興ししたり、センチメント(感情)分析を実現する。また、Amazon Kendraは、S3やRDS、外部サービスなどのデータを機械学習で分析し、自然言語で検索可能にする。さらに開発者向けにはMLを用いたコードレビューサービスの「Code Guru」を提供しており、先日はシステムの運用管理に役立つアラートを出す「DevOps Guru」も発表した。

 新発表された「Amazon Lookout for Metrics」は売り上げの急激な低下やセールスリードの枯渇など異常値検出を実現するサービスだ。

 従来のしきい値ベースの検出では、誤検知も多く、予測不能な状況に弱いという弱点があったが、Amazon Lookout for MetricsはAmazonが利用しているものと同じ機械学習のテクノロジーを用いており、高い精度の予測モデルが自動構成される。また、Amazon Lookout for Metricsでは、19のデータソース、6つのアラート手段を実現するためのコネクタが用意されている。

Amazon Lookout for Metricsの動作

 シバスブラマニアン氏は、「たとえば、ECサイトが不適切な価格で商品を出してしまった場合、いち早く検知できなければ、すべてが売り切れてしまうかもしれない。Amazon Lookout for Metricsではこうした異常値を事業上のメトリクスから簡単に割り出すことができる」と語る。

前へ 1 2 次へ

カテゴリートップへ