映像での物体認識は急速に発達しているものの、場面検知、すなわち実際に画面上で何が起こっているのかを認識する技術は遅れをとっている。だが、映像の中での行動を分析、認識できれば、映像編集のようなアプリに役立つかもしれない。
そこで、当時スタンフォード大学の学生で、現在はネットフリックスの上級データ科学者であるアミール・ジアイは、その最先端技術の発展に着手することにした。具体的には、ハリウッド映画のキスシーンを検知するというものだ。随分とお気楽で馬鹿げているように思えるかもしれないこの研究が、実は重要な意味を持っている。
ジアイは、100本の映画から部分的に選択した映像を、10秒から20秒の長さでさまざまなキスシーンとそれ以外のシーンとに分類。その後、各シーンの画像と音声を秒単位で抽出し、それらを利用して機械学習アルゴリズムを訓練した。その結果得られたモデルは、映像中のキスシーンの秒数を高精度で認識し、それらを分類できるものだった。
この研究は、特定の、ひいては親密な行動さえも分析する手法が、どれほど急速に進歩しているのかを示している。監視カメラの映像と組み合わせれば、たちまちオーウェルの小説さながらの意味合いを持つことになるだろう。事実、新たな報告によれば、アメリカ自由人権協会(ACLU)は、将来的にカメラの所有者が異常な行動をすばやく特定したり、恥ずかしい瞬間を探し出したりする可能性があると警告している。ディープフェイクと同様に、これもまたテクノロジストたちが自分たちの研究が招く結果について考えるべき事例なのだ。