5月20日、AI界隈でスカーレット・ヨハンソンさんの事案が大注目されました。OpenAIが発表した「ChatGPT」新モデル(GPT-4o)に搭載された「Sky」という音声が“不気味にそっくり”ではないかと本人からツッコミが入ったのです。一方で、日本では、声優の梶裕貴さんが「人間とAIとの共存」のために、自らの生成AIを作るクラウドファンディングを始めました。
スカーレット・ヨハンソンさん「そっくりAI音声」に怒り
ヨハンソンさんが出演した2014年に公開された『her/世界でひとつの彼女』は、離婚で孤独を抱えている男性が人工知能型OSに出会い、段々と恋愛感情を抱いていくという映画。アカデミー脚本賞も受賞しています。大規模言語モデル(LLM)の世界では、この映画で起きたような人間とAIとの関係性が発生し始めており、映画はAI理解のための基礎教養的な存在にもなってきています。ヨハンソンさんは、姿は登場せず、声だけのAIのサマンサ役を演じました。そのハスキーボイスは愛らしく、キャラクターへの説得感を生み出すのに重要な役割を果たしています。映画を見た多くの人が音声で語りかけるAIに出会えるなら、サマンサのような声で話しかけてほしいと思ったことでしょう。
OpenAIのサム・アルトマンCEOがGPT-4oの発表前に、「her」と一言だけ意味深につぶやいていて、何を意味するのかと話題を呼んでいました。結果的に映画で実現されている音声でのリアルタイム応答システムを発表する予告ではあったようです。
ところがGPT-4oの音声として発表された5種類の音声のうち、ハスキーな女性の音声Skyが、サマンサ──つまりヨハンソンさんに似ているというのが話題になりました。そして5月20日にヨハンソンさんがコメントを発表したのです。
ヨハンソンさんによると、2023年9月にOpenAIから声優としてのオファーを受けており、「悩んだ末、そして個人的な理由から、私はこのオファーを断った」としています。「公開されたデモを聴いたとき、私は衝撃を受け、怒り、そしてアルトマン氏が私の声と不気味なほど似ている声を追求することに不信感を抱きました。アルトマン氏は、私が人間と親密な関係を結ぶチャット・システム、サマンサの声を演じた映画にちなんで、『her』という一言をツイートし、その類似性が意図的なものであるとさえほのめかした」と書いています。
さらに、「ChatGPT4.0のデモがリリースされる2日前、アルトマン氏は私のエージェントに連絡し、再考を求めました。私たちが接触する前に、システムは世に出ていました」とコメント。その後、弁護士を雇い、アルトマン氏とOpenAIに音声を作成したプロセスを明らかにすることと、Skyの音声を削除することを求めました。
OpenAIは、GPT-4oにおいては、ヨハンソンさんの「懸念を尊重し」Skyのサービスを一時停止したと発表しました。ただし、日本のChatGPTアプリでは6月1日現在、Skyを選択することは可能です。そこで、劇中の「Hi, I’m Samantha」というセリフをGPT-4oに言わせてみました。サマンサ特有のハスキーボイスの雰囲気はあり、似せにいっている印象もありますが、同一人物の声かと言うと同じではなさそうだという印象を持ちました。
アルトマン氏は5月20日に、「スカイの声はスカーレット・ヨハンソンさんのものではありません。私たちは、ヨハンソンさんへの働きかけの前に、スカイの声を担当する声優をキャスティングしました。(略)ヨハンソンさんにはうまく伝えられなかったことをお詫び申し上げます」とのコメントを発表。OpenAIはブログを通じて、5月22日に声優を決定するための詳細なプロセスを明らかにしました。400人の応募者があり、最終的に5人を選出した後、2023年9月にその声をChatGPTに導入したとしています。
その上で、米ワシントン・ポスト紙に対し、OpenAIのAIボイスの開発に携わったジョアン・ジャン氏が声優の意思決定にはアルトマン氏がほとんど関わっていないこと、この声優の音声を長く聞いてきたものとしては、ヨハンソンさんの声に「似ても似つかない」というコメントを寄せています。
今後、この問題が継続し、裁判へ発展していくのかは、まだわかりません。
アメリカレコード協会の最高経営責任者であるミッチ・グレイジャーCEOは、「ヨハンソンさんが訴訟を起こせば、OpenAIに対して強力な訴えを起こす可能性がある」と述べています。アメリカでは、1988年に、モノマネ芸人が歌声をCMで再現したものに対する裁判で、真似られた歌手が勝訴したケースがあるようです。歌手のベット・ミドラー氏がフォード・モーター社を相手取って起こした訴訟で、ミドラーはアメリカの控訴裁判所で勝訴しており、このケースが当てはまるのではないかというわけです。ただし、アルトマン氏がヨハンソンさんの声を切望していたのは考えられますが、意識的に似せて開発したという証明をするのは、簡単ではないと考えられます。
また、SAG-AFTRA(映画俳優組合)は、ヨハンソンさんを支持するコメントを発表。「私たちは彼女の懸念を共有し、チャットGPT-4oの機能の『Sky』の開発で使用された音声に関して明確性と透明性を持つ彼女の権利を全面的に支持します」(プレスリリースより)としています。ただ、ヨハンソンさんの権利がどこまで及ぶのかが不明確なため、慎重な発言にとどめていました。アメリカでも、「声」の保護についての議論は続けられており、州法レベルでは保護を掲げる州も登場しているのですが、連邦法レベルではまだまだ議論はまとまっていないようです。SAG-AFTRAは、連邦法での新法制定による保護を求めています。
今回のケースは、有名人の声に似た声が許されるのかどうかというのが、焦点になっていますが、今後、そうでない人の声が使われていくことが普通になっていくと思われるため、こうした問題は起こりにくくなっていくとは思われます。実際、GPT-4oの残りの4人の声については、誰かに似ているといったことは、ほぼ話題になっていません。
この連載の記事
-
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは - この連載の一覧へ