このページの本文へ

Amazon PersonalizeとAmazon Forecastに関する説明会を開催

リコメンドと需要予測 Amazonで鍛えた2つの機械学習サービス

2019年10月30日 11時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 2019年10月29日、アマゾン ウェブ サービス ジャパンは機械学習サービス「Amazon Personalize」と「Amazon Forecast」についての説明会を開催した。Amazon.comで実績を積んだ機械学習のサービスをGUIから容易に利用できるサービスの強みと、EdTech企業のアイデミーによる具体的な活用事例が披露された。

過去20年に渡って機械学習に投資してきたAmazon

 発表会の前半、AWSジャパンの瀧澤与一氏は、AWSの機械学習サービスと今回のテーマであるAmazon Personalize、Amazon Forecastについて説明した。

アマゾン ウェブ サービス ジャパン 技術統括本部 レディネス&テックソリューション本部 本部長 /プリンシパルソリューションアーキテクト 瀧澤与一氏

 Amazonは過去20年に渡って機械学習への投資を行なっており、商品のリコメンデーションや物流や在庫管理の最適化、Alexaのような製品で活用されている。「単なるおもちゃではなく、実ビジネスで使っているのが特徴」(瀧澤氏)という。こうしたAmazonの機械学習のノウハウや成果物を顧客に対してサービスとして提供しているのがAWSだ。

 機械学習はデータの取得と前処理、モデルの開発・学習・評価などを経て、本番環境へのデプロイといったワークフローで運用される。運用開始後も監視と評価、データ収集を繰り返し、このサイクルをいかに早く回せるかが成否を分ける。しかし、データの収集が進まなかったり、ツールの利用が難しかったら、機械学習の運用は進まない。そのため、AWSではユーザーのスキルセットに合わせた機械学習サービスのスタックを用意している。

機械学習のサイクル

 機械学習(ML)のスキルなしで利用できるAWSのAIサービスは、静止画や動画の認識、音声やテキスト処理の自動化、チャットボット、時系列データの予測、リコメンデーションなど10種類以上用意されている。その他、モデルの開発や学習を効率化するSage MakerのようなMLサービスのほか、TensorFlowやMXnetのようなMLフレームワーク、各種のインスタンスや専用ハードウェアなど、さまざまな機械学習向けサービスを提供している。Amazon PersonalizeとAmazon Forecastは、このうちAIサービスに当たる。

Amazon Personalize、Amazon Forecastとは?

 Amazon Personalizeは、顧客個々人の商品やサービスの購入履歴に基づいてさまざまなリコメンデーションを実現するサービス。Amazon.comと同等の技術を、幅広いユーザーに対して、迅速に実装できるという。具体的には、ユーザーの行動をリアルタイムにリコメンドに反映できるほか、履歴の少ないユーザーや個人に最適化されたリコメンデーションなどが可能になる。

 利用方法としては、Amazon S3に保存した行動履歴やリアルタイムデータをAmazon Personalizeに読み込ませることで、データの検査、特徴の認識、アルゴリズムやハイパーパラメータの選択、モデルの学習や最適化、保存、デプロイとモデルのホスト、キャッシュの作成までを実現し、カスタマイズされたレコメンデーションAPIが出力される。データセットの読み込みやトレーニングの実行、APIの作成まではすべてマネジメントコンソールで完結し、アルゴリズムの選定やハイパーパラメーターの調整も自動的に行ってくれるという。

Amazon Personalizeの機能

 一方、Amazon Forecastがカバーする「Forecasting」とは時系列データの変化を予測し、将来のビジネスニーズをつかむ科学的な手法を指す。在庫や人員配置、財務予測、キャパシティ管理など幅広い領域で利用でき、日用品や季節変動のある商品の需要予測が可能になる。一方、高価な商品や地域や国ごとに需要が異なる商品、購買頻度の低い商品では需要予測が難しいという特徴がある。

 これに対してAmazonでは、2007年にSQRF(Sparse Quantile Random Forest)というモデルを用いた機械学習で予測問題の解決に乗り出す。数十億のトレーニングデータへの対応、疎なデータや欠損のあるデータでの予測などには成功したが、関連商品の需要履歴で精度を向上させることは難しかった。しかし、2015年にディープラーニングを導入したことで、正確性(accuracy)は一気に15倍に向上した。現在、Amazonは毎日4億以上の商品需要を行ない、1万を超える郵便番号で需要予測している。正確な予測により、12以上の出荷方法から適切な方法を選択できているとのことだ。

ディープラーニングで正確性が15倍向上

 こうしたAmazon.comと同じ技術に基づいてビジネスを予測できるのが、Amazon Forecastになる。こちらも履歴データや関連データを入力し、機械学習のモデルをトレーニングさせれば、プライベートなAPIで予測結果を取得できる。季節性のあるデータ、構造化されたメタデータ、関係変数、履歴のないアイテムなどでも利用でき、トレーニングとテストで精度を上げ、中央値、最大値、最低値などをグラフで出力することが可能になる。事例では、倉庫スペースや人材、輸送リソース、電気・ガスの消費量、売り上げや在庫、収益性、市場シェアなどさまざまな予測にに用いられているに使われているという。

GUIで予測モデルが簡単に構築できる

 発表会においてAmazon Forecastの検証結果を披露したのが、データサイエンスなど先端技術に特化したオンラインプログラミング学習サービス「Aidemy」を提供するアイデミーになる。今回登壇した竹原氏はアイデミーのデータサイエンス部に所属しており、教育サービスでのログ解析を担当している。

アイデミー 執行役員 AI統括 竹原大智氏

 Aidemyはプログラミングを学びながら、環境構築なしで、ブラウザ上でコーディング演習を実践できる。そのため、演習においては、機械学習のコードを提出すると、RUNサーバーでの実行結果が返される。逆に言えば、演習回数が多いとRUNサーバーの負荷が大きくなるため、演習回数の予測が重要になるという。竹原氏は、「通常は大きめのリソースを用意しているのですが、需要に応じて動的に変更できればコストの最適化が可能になる」と語る。

 もともとアイデミーではMLサービスのSage Makerでモデルを構築して演習回数を予測しようとしていたが、よりシンプルなAmazon Forecastを試してみたという。具体的には演習回数の履歴データ(CSVファイル)を入力するだけで予測が実現でき、GUIコンソールで出力したり、Pythonと連携させて結果を取得できたという。

 予測結果に関しては、10%、50%、90%と異なる分位数で確率的な予測が行なわれているが、予測を大きく上回る演習回数になるとサービスが正常動作しなくなる可能性があるため、最大値90%を採用した。竹原氏は、「CSVファイルを用意するだけで、GUIで予測モデルを構築できるので簡単でした」と感想を語る。今後はインスタンス数の調整につなげ、コストの最適化に活かしていくという。

カテゴリートップへ

ASCII.jp特設サイト

クラウド連載/すっきりわかった仮想化技術

ピックアップ