画像生成AIの学習に使われる「Danbooru」をどう理解すべきか
これらのモデルが強力になったのは、Danbooruやe621のようなキュレーションサイトのデータを学習データにしたからというのは間違いないでしょう。悩ましいのは、これらのサイトの存在をどう理解すべきかということです。
欧米圏に存在するキュレーションサイトは、PixivやX(旧Twitter)などから、ユーザーが画像を転載して独自にタグ付けをしています。Danbooruは特に日本のアニメやイラストに強いことで知られており、たびたび無断転載の問題が指摘されています。一方で、アメリカの著作権法上では、転載元が明記されているのでフェアユースという合法の概念に当たるのではないかという説もあります。他のキュレーションサイトも含め、批判を受けながらサービスの継続ができているのは、それが理由ではないかとも考えられています。
また、Danbooru自身がAI用の学習データとして利用しているのではなく、中国、韓国、台湾といった地域の個人や事業者がデータセットを作成して利用しています。各国の法律上で、キュレーションサイトのデータを学習に使った場合の位置づけは明確ではありませんが、現実として学習に使われている事実があります。さらに作成されたモデルは、米国のHugging FaceやCivitAIにアップロードされ、世界各地のユーザーがダウンロードできるという状態にあります。今のところ、これらが明確な著作権侵害に当たるという根拠は世界的に出ていません。
今は技術力をアピールするためか、IlustriousやNoobAI-XLも何を学習データにしたのかを明らかにしていますが、その状況も変わってくるでしょう。Stablity AIなどのハイエンドモデルの基盤モデルを開発している企業は、公開するメリットがなくなっているので、詳しい情報を明らかにしなくなっています。遠からずアニメ系モデルの開発企業も、その段階へと移り、何を学習したのかを明らかにしなくなると考えられます。
その一方で、画像生成AI利用者にとっては、こうしたモデルには著作権侵害のリスクがあるということを強く意識する必要があります。日本の著作権法の場合には、「類似性」と「依拠性」の両方を満たすことで、著作権侵害が成立します。「1girl」というシンプルなプロンプトであっても、データの偏りによって、何か似てしまう可能性がありうることが、Illustriousの技術レポートには書かれています。出力した結果が、何らかの画像にそっくりで意図しない著作権侵害を引き起こしてないかを、Googleレンズ等を使って確認する必要があるでしょう。もちろん、アニメ等のキャラクターを生成し、SNSに公開する場合には、二次創作イラストと同じ扱いになり、侵害リスクが大いにあることには注意が必要です。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 -
第147回
AI
ゲーム開発開始から3年、AIは“必須”になった──Steam新作「Exelio」の舞台裏 -
第146回
AI
ローカル音楽生成AIの新定番? ACE-Step 1.5はSuno連携で化ける -
第145回
AI
ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う -
第144回
AI
わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった -
第143回
AI
AIエージェントが書いた“異世界転生”、人間が書いた小説と見分けるのが難しいレベルに -
第142回
AI
数枚の画像とAI動画で“VTuber”ができる!? 「MotionPNG Tuber」という新発想 -
第141回
AI
AIエージェントにお金を払えば、誰でもゲームを作れてしまうという衝撃の事実 開発者の仕事はどうなる? -
第140回
AI
3Dモデル生成AIのレベルが上がった 画像→3Dキャラ→動画化が現実的に - この連載の一覧へ







