image2imageでラフや写真が画像になる
Stable Diffusionの強みは画像から画像を生成する「image2image」が使えること。たとえば私の近影を使って「巨乳」「美少女」「サイバーパンク」などのプロンプトを入れて処理すると、こんな画像が生成されます。冗談のようですが、それでもメガネや着ている黒い服の影響が残り続けているのがわかると思います。
#stableDifusion#WaifuDiffusion のimg2imgで遊んでいたのですが、絶対巨乳の女性が出てくるプロンプトを公開されている @Muacca 様のデータを試しに自分のプロフィールデータに使ってみました。重みを軽くするに連れて、私がどんどん別人になっていく…w pic.twitter.com/DCkxDFq8qj
— 新清士『メタバースビジネス覇権戦争』発売中 (@kiyoshi_shin) September 29, 2022
ソフト上でマスクもかけられるので、「flower」などのプロンプトを使って前景に花を配置するといったこともできるようになっています。
Stable Diffusionと同時期に話題を作った画像生成AI「Midjourney」にも同機能は搭載されているのですが、いま最もきれいな画像を出すにはテスト機能であるプロンプト「--test」の使用が必須です。ところがimage2imageとこのテスト機能は10月5日時点で共用できず、より複雑な画像を追求できません。今後のアップデートスケジュールも明確に示されていない状態です。アート的には優れたものが出ますが、一旦image2imageに慣れると物足りなくなってしまいます。
一方、画像生成AIにはまだ複雑なポーズが苦手という課題が残っているようです。描きたいポーズを指定してimage2imageで画像にしている人もいますが、やや不自然です。何度も生成していると、腕が何本も発生したり、指も何本も生まれたりということが起きる傾向があります。これらをどうすれば発生させないようにできるのかは、今後の技術発展の着目点だと言ってもいいでしょう。
お花畑でわきあいあい#stablediffusion#trinart#AIお絵描き#kawaiipic.twitter.com/z0ONfxAjiW
— tamezo ushiyama (@tameushi) September 29, 2022
実際に、そうした弱点を克服しようという企業も出てきています。10月3日に商用サービスとして発表されたNovel AI Diffusionは、腕が自然になるようにアルゴリズム的な工夫をしているようです。指はまだ不自然なようですが、それでも他の学習パッケージより改善されてるように見えます。特定のキャラクターの再生産に対応できるようで、まだサービス開始直後で多くのユーザーが模索をしているところですが、遠からず画像生成AIだけで漫画が描けるようになってしまうかもしれません。
Waifu Diffusion だと一瞬で崩壊した寝そべってる構図も NovelAI なら平気で生成できる...#NovelAIDiffusionpic.twitter.com/LFl2Nt66rR
— Plat 🖼️ (@p1atdev_art) October 3, 2022
世界はこの数ヵ月で変わってしまった
image2imageを使っていて思うのは、画像生成AIをめぐる著作権の扱いがどんどん難しくなりそうだということです。重みづけを変えて出力していくと、生成される画像は元絵とどんどん類似性がなくなっていくわけですが、そのときに生成された画像の著作権はどう判断されるのか。写真でも同じことが起きるんですが、たとえばアイドルの写真をもとに画像を生成した場合、その権利はどうなってしまうのかというのは、今後の課題だと思います。重み付けが低いうちは元の写真だと判断がつくのですが、ある一定の線を超えると、もう元の写真が何であるのかはまったくわからなくなってしまいます。
いずれにしても、これだけのことがわずかこの数ヵ月で起きてしまうというのが本当におそろしいですね。深津貴之さんが「世界変革の前夜は思ったより静か」と書いていましたが、本当に想像以上にすさまじい変革が起きています。
今起きていることは、絵画史のなかで、19世紀後半に写真が一般の人にも手に入るようになり、急激に普及が起きた時期に近い歴史的な転換点に当たると思います。肖像画という存在が写真に取って代わられる時期です。しかし、それにより印象派などの新しい絵画表現方法の登場が促されることになります。画像生成AIは人類にとって、それが登場する以前と以後とで大きく時代に差をつけるものであることは間違いありません。しかし、だからといって絵を描くという営みが消えることはないでしょう。むしろ、人間の創造性の幅を広げる可能性が高いと私は考えています。
この連載の記事
-
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? - この連載の一覧へ