アマゾンのクラウドコンピューティング部門であるAWS(Amazon Web Services)は2月21日(現地時間)、多数の機械学習モデルをホスティングするプラットフォームを運営するHugging Faceとの提携強化を発表した。これは両社が2021年初頭に開始した既存の協力関係を発展させたものとなる。
Amazon SageMakerと統合し、短時間で機械学習が可能に
ニューヨークを拠点とするHugging Faceは、開発者がオープンソースのAIモデルや、トレーニングデータセットなどの技術資産をホストするために使用するGitHubに似たプラットフォームを運営している。
ここには現在10万を超える無料でアクセス可能な機械学習モデルのコードが保存されており、研究者、データサイエンティスト、機械学習エンジニアによって毎日100万回以上ダウンロードされている。
本日発表されたパートナーシップ拡大の一環として、Hugging FaceはAWSを優先的なパブリッククラウドとして使用する予定であり、さらにAWSが運営する機械学習プラットフォームAmazon SageMakerとの新たな統合を展開する。
これにより開発者はHugging FaceにホストされているBERTやGPT-2といった事前学習済み機械学習モデルを、わずか数行のコードでインポート、トレーニング、微調整を行ない、SageMakerにデプロイ(利用できる状態にすること)することが可能になる。
トレーニングに最適化されたAWS Trainiumチップを搭載したクラウドインスタンスを利用することで、これまでは数週間かかることも珍しくなかった作業がたった数時間で終了できるという。
機械学習の民主化実現にむけて
機械学習は近年あらゆるアプリケーションに急速に組み込まれつつあり、テキスト、音声、画像を処理・生成するTransformerやDiffuserといったモデルが次々に登場している。
しかし、これらの生成系AIモデルのほとんどは一般に公開されておらず、ビッグテックとそれ以外の研究者の間で機械学習能力の差が広がっていることが問題になっている。
Hugging Faceはこの提携の目的を「機械学習の民主化を実現するため」としており、CEOのクレメント・デラング氏は、「AIの未来はここにあるが、それは均等ではない。Amazon SageMakerとAWSが設計したチップにより、我々のチームおよび機械学習コミュニティは、最新の研究を誰もが構築できるオープンなものになる」と述べている。
また、デラング氏は「マイクロソフトが支援するOpenAIのChatGPTに匹敵するオープンソースのAIモデル、Bloomの次世代版はAWSが作った独自の人工知能チップ、Trainium上で実行される」とも述べておりAIのオープンソース化について歓迎の意を示している。
歓迎される要素しかないと思われるこの提携だが、マイクロソフトAzureとOpenAIの関係を意識していることは明白。グーグルやMETAを含めどの陣営もAIで覇権を取ることに血道を上げている現在、アマゾンも紛うことなき営利を目的とするビッグテックだということを忘れてはいけない。