機械学習のワークフローからバイアスを検出する「SageMaker Clarify」発表

より広く、深く進化するSageMaker　機械学習における継続的な品質管理を実現

2020年12月14日 09時30分更新

文● 大谷イビサ　編集●ASCII

　オンライン開催されているAWS re:Invent 2020において、12月9日に行なわれたのがAWSのAmazon Machine Learning担当バイス・プレジデントのスワミ・シバスブラマニアン（Swami Sivasubramanian）による機械学習（ML）フォーカスの基調講演だ。ここではプロ仕様とも言えるSageMakerのアップデートとユースケースにフォーカスした前半の内容を振り返る。

AWS Amazon Machine Learning担当バイス・プレジデントのスワミ・シバスブラマニアン

Amazon SageMakerで分散トレーニングを実現

　今年、独立して設けられた機械学習セッションは、ユーザー事例からスタートした。ピザの発注予測にMLを利用するドミノピザ、融資に利用するカベージ、自動車開発に利用するBMW、買い物体験を充実させるナイキなどがMLでサービスの革新を実現している。シバスブラマニアン氏は「選ばれる理由は広さ、深さ、革新的なサービスの速さ」とアピールし、Sage Makerのアップデートとを次々と紹介した。

　AWSの機械学習サービスは、大きくMLインフラ・フレームワーク、Amazon SageMakerによるML開発、MLを活用したAIサービスという3つのレイヤーで構成されている。「今年だけでもすでに250以上の新機能を追加している。もっとも包括的なMLツールを提供していると自負している」とシバスブラマニアン氏は語る。同氏が過去関わってきたAmazon S3やDynamoDBがインフラ調達においてエンジニアを支援したのと同じく、機械学習においてもあらゆるスキルレベルの人に開発する自由を提供できるようになったという。

250以上の新機能を追加

　最初は、MLフレームワークや機械学習に最適化されたインスタンスやハードウェアを紹介。まずはTensorFlow、PyTorch、MXNetなど幅広いフレームワークが利用でき、現在ではTensorFlowのワークロードの92％、PyTorchのワークロードの91％がAWS上で稼働しているとアピール。また、機械学習に最適化されたインスタンスや推論を高速化するInferentia、トレーニング処理用のTrainiumなどの専用チップなども用意している。

　こうした高速化の手段として、SageMakerには分散トレーニングを容易に実現する機能が追加された。従来、Sage Makerが投入された2017年当初、トレーニングは垂直型スケーリングしかなかったが、その後分散型スケーリングが台頭。今回のAWSの実装ではデータ分割とモデル分割という2つのアプローチを利用でき、数行のコード追加だけで複数のGPUインスタンスへの分散処理を自動的に実現する。ベンチマークでは、コンピュータービジョン用の「Mask-RCNN」では28分かかっていたTensorFlowでのトレーニングが6分13秒に。また、自然言語処理で用いられる「T5-3B」では数週間かかっていたPyTorchでのトレーニングが5.9日に短縮されたという。

分散処理により、コンピュータービジョンや自然言語処理のトレーニング高速化を実現

NFLやイントゥイットでのSage Makerの活用事例

　複雑でコストのかかる機械学習の開発を効率的に進められるML開発環境がSageMakerになる。データ収集、アルゴリズムの選択、トレーニング環境の準備、トレーニングとチューニング、デプロイ、拡張といった一連の操作を統合した環境で、過去1年間で50以上の新機能を投入しているという。

　SageMakerのユーザーも紹介された。トレーニング時間を日単位から時間単位に短縮したライドシェアのLYFT、顧客メッセージのラベリングをMLで効率化した通信事業者のTモバイルのほか、ワークロードの高速化、デリバリ経路の最適化などMLの利用用途は増え、イノベーションは加速している。

　ユーザー事例として登壇したのはNFL（全米フットボールリーグ）のジェニファー・ラントン氏だ。大学時代、怪我でアスリートとしての活動を断念したというラントン氏は、現在NFLの健康・イノベーション担当として、プレイヤーの安全と健康を実現すべくテクノロジーの活用を推進している。

　AWSをパートナーとして2017年に構築された「Next Gen Stats」は、アメフトの試合中のプレイヤーの位置やスピード、加速度をキャプチャし、リアルタイムに分析するというもの。プレイを楽しむための分析をファンに提供するだけではなく、データ分析によって怪我を減らすことにも貢献している。

NFL（全米フットボールリーグ）で健康・イノベーションを担当するジェニファー・ラントン氏

　過去6年間、NFLではバイオメカニカルエンジニアがプレイヤーの脳しんとうを減らすため、怪我に結びつく衝突を分析し、安全なヘルメットの開発に活用してきた。データに基づいて開発された安全なヘルメットの利用はすでに100％におよび、2018年は脳しんとうが24％も削減されたという。「よりよいヘルメットやプロテクターを使い、安全なタックルを行ない、ルールを変えるということ。これはデータとイノベーションがあってこそ」とラントン氏は語る。

　NFLはコンピュータービジョンとSageMakerを用いたデータ分析を継続的に進めており、今後は脳しんとうのみならず、足首の怪我などにも適用範囲を拡げていく予定。ゆくゆくはNFLのみならず、怪我を減らすというための取り組みとして社会への還元も視野に入れているとのこと。

　イントゥイットは、機械学習によって確定申告を容易に行なえるようにしている。「機械学習はすでに彼らのビジネスの重要な部分を占めており、不正検知やカスタマーサービス、パーソナライズで活用されている。昨年だけでもモデルの数を50以上増加させ、コスト削減や審査時間の半減などを実現した」とシバスブラマニアン氏はアピールする。

前へ 1 2 次へ

ツイートする

カテゴリートップへ