AIで生成した画像を動画にできるようになった。当連載のオリジナルキャラクター「明日来子さん」にメガネをかけてもらったところ。レンズの屈折まで反映されている(hailuo AIで作成)
2024年、画像生成AIに起きたことを振り返ってみます。今年もすさまじいペースで物事が動きました。今年起きたことに注目するなら、高精細化と高品質化が進む一方、一貫性をいかに実現するのかがポイントでした。一貫性技術は、動画生成AI分野の拡大をもたらし、さらに、3D化の実現までも可能性として見せはじめました。それぞれの技術はお互いに影響を与えつつ、別々に進化し、より専門化が進んでいます。この連載によく登場してくる作例のキャラクター「明日来子さん」を通じて、どのように技術変化が進んだのかを見ていきましょう。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
同じキャラクターが出せるようになった
まず、2023年12月に登場したクラウド型画像生成AIサービス「Midjourney」バージョン6で写真と品質的に見分けがつかないような画像が生成できるようになりました。それで作った「明日来子(あすきこ)さん」がこの連載に登場したのが1月です。現在、Midjouneyはv6.1にアップデートし、写真的な描写はさらに得意になっています。
何となく作った後に「明日来子さん」という名前をつけた作例(「“世界生成AI”到来か 画像生成AIのゲームエンジン化が進む」 より)
画像生成AIにとって大きな課題点だったのは、人物などのキャラクターの首尾一貫性をどのようにして担保するかという点でした。生成AIの特性上、結果がランダムに生成されるため、同じ顔を繰り返し生成するのが難しいためです。Midjourneyは3月に、1枚の画像から特定のキャラクターを似せて生成できる「クリエイティブリファレンス」というコントロール系の機能を搭載しました。Stable Diffusionで登場した類似画像生成機能「IP-Adapter(IPアダプター)」に似た機能を、Midjourneyに実装し、より強力に出せるようにしたものです。完全にそっくりとはいきませんが、同じ人物に近い画像が出せるようになり、それを「アニメ風」「絵画風」など様々なタッチに変更して出力できるようになりました。
クリエティブリファレンスを使うことで、明日来子さんのオリジナル画像から、顔を似せたまま着物姿や別の表情を簡単に作れるようになった(「画像生成AIで同じキャラクターが簡単に作れるようになってきた」 より)
その後、5月に敏腕開発者のlllyasviel(イリヤスフィール)さんがStable Diffusion向けに出したのが、画像生成時に照明効果をコントロールする技術「Imposing Consistent Light(IC-Light)」でした。これによって画像のバリエーションが出しやすくなりました。最初のバージョンはStable Diffusion 1.5ベースでしたが、10月には最新モデルのFlux.1に対応した「IC-Light V2」がリリースされています。
IC-Lightを使うことで、オリジナル画像(右)を逆光のようなライティング(左)を簡単に生み出せるようになった(「画像生成AIに照明革命 日本と世界で同時に“神ツール”登場」より)
そして、6月に登場して業界に衝撃を与えたのが、Luma AIの動画生成AIサービス「Dream Machine」です。それまでの動画生成AIサービスには弱点がありました。人物の一貫性を維持できないという点でした。生成するとすぐに別の人に変わってしまうのです。この問題を、キーフレームという最初の画像と最後の画像とを指定することによって、途中で崩れるにしても、極端な崩壊が起きるのを抑制できるという方法です。この技術がきっかけで破綻の少ない動画を作れるようになりました。そして、動画生成AIサービス各社がこの機能をマネして実装してくるようになりました。
▲明日来子さんの画像を最初と最後に指定して生成したもの。途中の顔は完全に崩れているのだが、5秒間という短い間ならば、なんとかごまかせている(「AI動画の品質が仕事に使えるレベルになってきた」より )
同じ6月に出てきたのがイラスト制作用AIツールのクラウドサービス「Copainter」。下書きからの線画作成、下塗りをしたものを着彩したりといったことを画像生成AI技術によって実現するものです。高解像度化や写真を漫画の背景画像に使えそうなものに変換したりと、その後も機能充実を続けています。技術に詳しくなくても使いやすいこともあり、漫画制作に生成AIを使う人達を中心に広がっているようです。イラスト作成ツールが生成AI分野に進出しない状況が続いているため、今後もその領域に広がっていきそうです。
筆者が、明日来子さんの画像を見ながら行った模写(左)、Copainterで線画作成したもの(中央)、さらに着彩をしたもの(右)(「イラストのペン入れと色塗り、AI使えばわずか1分」より )

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ





