このページの本文へ

AIは文化的に偏り、グーグルが是正へコンペ

2018年12月05日 06時03分更新

文● Karen Hao

  • この記事をはてなブックマークに追加
  • 本文印刷

グーグルが、画像認識ソフトウェアの「文化的な流暢さ」を拡張しようとする取り組みの1つとして、「インクルーシブ・イメージズ・コンペティション(Inclusive Images Competition、包括的画像コンペ)」を開催した。コンペ参加者に与えられた課題は、文化的に偏った画像のデータセットで訓練されたコンピューター・ビジョン・システムの偏向を減らすことだ。

機械に対象を認識させるには、大量の画像データで訓練する必要がある。画像認識システムにおける最近の飛躍的な進歩は、「イメージネット(ImageNet)」や「オープン・イメージズ(Open Images)」などの、公けに利用可能な大規模データセットが公開されたことと関係している。

しかしもっとも広く使用されているデータセットは、米国や西側諸国のものに偏っている。それは、データセットを収集した際に、西側諸国の画像がインターネットで支配的だったという単純な理由によるものだ。結果として、そうしたデータで訓練されたシステムはしばしば、他の文化や地域の場面を正確に説明することができない。結婚式の写真を例に挙げてみよう。オープンソースのデータセットで訓練された標準的な画像認識システムでは、西洋の古典的な伝統に沿った白いドレスの花嫁は認識できる。しかし、インドの結婚式におけるサリーをまとった花嫁は認識できない。

このような問題を減らす1つの方法は、より多様で典型的な画像データセットを構築することだ。グーグルはこの方法も追求している一方で、他の方法を進歩させることも有効だと考えている。それは機械学習アルゴリズム自体を工夫して、不完全なデータからより包括的に学べるようにすることだ。

人工知能(AI)研究における最大の年次会合の1つである「神経情報処理システム(NeurIPS)カンファレンス」との共催で実施されたコンペには、100人以上の参加者から応募があった。グーグル・ブレイン(Google Brain)・チームの研究者であるパーラヴィ・バルジェカは12月2日のNeurIPSカンファレンスで、初年度のコンペ優勝者がより包括的なシステムに向けて小さな前進を見せたと語った。しかし、インドの花嫁の認識に成功したのは、コンペで上位に入った5つの手法のうち、1つでしかなかった。さらなる研究が必要なことは間違いない。

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ