このページの本文へ

西田宗千佳の「AIトレンドトラッキング」 第3回

楽天、ソフトバンクの“生成AI戦略”に注目【AIニュースまとめて解説】

2023年08月24日 07時00分更新

文● 西田宗千佳 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

PayPayフリマ、生成AIで商品説明文を自動作成する新機能(8月3日)

 やっていること自体はシンプルで、似たことを考えているところは多いだろう。出品のための手間を減らすサービスとしては有用だ。

 この機能の狙いは、PayPayフリマを使う個人客の拡大だろう。フリーマーケットサービスは、個人以上に業者が使っている。業者の場合にはすでにサポートツールなどを使って効率化していて、わざわざ生成AIから文面を提案してもらう必要はない。だが、個人の利用を促進するなら「いかに楽にするか」が重要。だからこういう機能が必要になってくる。

生成AIによる著作権問題、日本弁理士会が論点整理(8月7日)

 生成AI、特に画像に関しては著作権関連の疑問が語られることが多い。その内容を整理した記事。基本的な部分は意外と「生成AIならでは」の話ではないのだが、人間の感情の変化によって生成AIで作られたものに対する反応が変わり、争点が生まれる可能性がある。一読をお勧めする。

OpenAI、ウェブクローラー「GPTBot」を公開。ChatGPTにデータをクロールされない方法を提供(8月9日)

 大規模言語モデル(LLM)の学習には大量のデータが必要になるため、ネットに公開されている文章が収集されて使われることが多い。この点は、OpenAIもGoogleも同じような考え方で臨んでいる。

 一方、検索エンジンによる情報収集を避けるように、LLMの学習ソースになることを避けたい、という企業やサービスもあるだろう。OpenAIはこれから運用する新しいウェブクローラーについて、対応方法を公開した。

 ただ、LLMの学習ソース獲得はどんどん厳しさを増している。

 大手メディアは記事を有料で提供する「ウォールド・ガーデンモデル」への移行を進めているが、これは元々、「ネット広告による無料モデルでの収益拡大と質の担保には限界がある」という考え方からだ。さらに生成AIが広がると、記事の価値はメディアには残らず生成AI側に吸収されてしまうのではないか……という懸念は根強い。

 The New York Times(NYT)は8月3日にウェブ版の利用規約を更新し、文章や写真などのコンテンツから誌面の見た目、内部のメタデータに至るまで、ほとんどの情報について、「機械学習やAIのトレーニンング、ソフトの開発」に利用することを禁じた。自動ツールによるクロールについても、無許可での利用は許可なしに利用できない旨記載が設けられている。

 とはいえこの話は、同社が生成AIでの学習を「一切させない」ということではない。

 NYTは2月にGoogleとの間で、コンテンツ利用について3年間・1億ドルで契約を結んでいる。そのため、他社(要はOpenAI)が契約なしに利用することに制限をかけたかったのだろう。

 7月13日、OpenAIはAP通信との間で、2年間の契約に合意したと発表している(OpenAI、AP通信と提携し過去ニュースをトレーニングに使用)。これもNYTの例とほぼ同じ考え方だ。

 大手生成AIプラットフォーマーによる「学習データの囲い込み」はより激しくなっていきそうだ。

カテゴリートップへ

この連載の記事
ピックアップ