このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第79回

AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質?

2024年09月16日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

Googleフォトなどの個人データからも学習か

 グーグルが他社のサービスを圧倒するリアリティをどうやって実現しているのかが気になってきます。

 ここからは筆者の推測になりますが、ネットから収集した公開情報だけでなく、Googleフォトなどの個人データからも学習していると考えられます。Googleフォトは2015年にサービスとして開始され、2021年5月までは無料・無制限で画像をアップロードできるサービスとして展開、2021年6月からは15GBまでは無料という方針で運営されています。当初無料で運用された重要な目的には、グーグルがAI用の学習データを収集するという目的があったのではないかと推測されています。

 現在のGoogleフォトには機能追加されてきた顔認識や場所のカテゴライズ、被写体の中身が何であるのかといったタグ付けが自動でされるようになっています。これらの技術は生成AI関連の技術が多く含まれます。

様々なカテゴライズ画面が並ぶ筆者のGoogleフォトのデータ検索の画面(一部にぼかしをかけてある)

 グーグルはGoogleフォトをAI学習に利用しているかどうかを一切明らかにしていません。

 ただ、利用規約には、グーグルの権利として「ユーザーのコンテンツに対する使用許可」という項目があります。そのなかで「ユーザーのコンテンツに修正(形式の変更、翻訳など)を加えて二次的著作物を作成すること」があり、目的として、「サービスを運営し改善するため」としており、「これには、自動化されたシステムやアルゴリズムを使用してユーザーのコンテンツを分析することも含まれます」となっています。もちろん、この項目以外に「プライバシーポリシー」が定められており、グーグルが安全性に配慮しているということもアピールされています。

 そのため、基本的にはGoogleフォトに投稿されているデータを使う権利をグーグルが持っていると読める内容になっています。Midjourneyなどと比べても圧倒的にリアルな画像を出せているのは、それだけ、手元で使うことができる学習データに規模の差があることが推測できます。

 ただし、グーグルはMidjourneyやFLUXなどと異なり、Imagen 3をアートやホビー向けに出しているわけではないでしょう。グーグルはImagen 3を、広告などの法人向けのビジネスなどに使うことを想定しているのだと思います。フィルターの強さを見ても、画像生成AIとしては使いにくく、直接的な競合として競争するのは難しいと思えます。ただ、世界で最も強力な画像生成AIの一つを持っているという意味は、マイクロソフトやアップル、メタなどと争う上で非常に強力な武器であることは間違いありません。

 

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ