2024年、画像生成AIに起きたことを振り返ってみます。今年もすさまじいペースで物事が動きました。今年起きたことに注目するなら、高精細化と高品質化が進む一方、一貫性をいかに実現するのかがポイントでした。一貫性技術は、動画生成AI分野の拡大をもたらし、さらに、3D化の実現までも可能性として見せはじめました。それぞれの技術はお互いに影響を与えつつ、別々に進化し、より専門化が進んでいます。この連載によく登場してくる作例のキャラクター「明日来子さん」を通じて、どのように技術変化が進んだのかを見ていきましょう。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
同じキャラクターが出せるようになった
まず、2023年12月に登場したクラウド型画像生成AIサービス「Midjourney」バージョン6で写真と品質的に見分けがつかないような画像が生成できるようになりました。それで作った「明日来子(あすきこ)さん」がこの連載に登場したのが1月です。現在、Midjouneyはv6.1にアップデートし、写真的な描写はさらに得意になっています。
画像生成AIにとって大きな課題点だったのは、人物などのキャラクターの首尾一貫性をどのようにして担保するかという点でした。生成AIの特性上、結果がランダムに生成されるため、同じ顔を繰り返し生成するのが難しいためです。Midjourneyは3月に、1枚の画像から特定のキャラクターを似せて生成できる「クリエイティブリファレンス」というコントロール系の機能を搭載しました。Stable Diffusionで登場した類似画像生成機能「IP-Adapter(IPアダプター)」に似た機能を、Midjourneyに実装し、より強力に出せるようにしたものです。完全にそっくりとはいきませんが、同じ人物に近い画像が出せるようになり、それを「アニメ風」「絵画風」など様々なタッチに変更して出力できるようになりました。
その後、5月に敏腕開発者のlllyasviel(イリヤスフィール)さんがStable Diffusion向けに出したのが、画像生成時に照明効果をコントロールする技術「Imposing Consistent Light(IC-Light)」でした。これによって画像のバリエーションが出しやすくなりました。最初のバージョンはStable Diffusion 1.5ベースでしたが、10月には最新モデルのFlux.1に対応した「IC-Light V2」がリリースされています。
そして、6月に登場して業界に衝撃を与えたのが、Luma AIの動画生成AIサービス「Dream Machine」です。それまでの動画生成AIサービスには弱点がありました。人物の一貫性を維持できないという点でした。生成するとすぐに別の人に変わってしまうのです。この問題を、キーフレームという最初の画像と最後の画像とを指定することによって、途中で崩れるにしても、極端な崩壊が起きるのを抑制できるという方法です。この技術がきっかけで破綻の少ない動画を作れるようになりました。そして、動画生成AIサービス各社がこの機能をマネして実装してくるようになりました。
▲明日来子さんの画像を最初と最後に指定して生成したもの。途中の顔は完全に崩れているのだが、5秒間という短い間ならば、なんとかごまかせている(「AI動画の品質が仕事に使えるレベルになってきた」より )
同じ6月に出てきたのがイラスト制作用AIツールのクラウドサービス「Copainter」。下書きからの線画作成、下塗りをしたものを着彩したりといったことを画像生成AI技術によって実現するものです。高解像度化や写真を漫画の背景画像に使えそうなものに変換したりと、その後も機能充実を続けています。技術に詳しくなくても使いやすいこともあり、漫画制作に生成AIを使う人達を中心に広がっているようです。イラスト作成ツールが生成AI分野に進出しない状況が続いているため、今後もその領域に広がっていきそうです。
この連載の記事
-
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは - この連載の一覧へ