このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第87回

画像生成AIの進化が早すぎる 2024年に起きたことまとめ

2024年12月09日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

AIで生成した画像を動画にできるようになった。当連載のオリジナルキャラクター「明日来子さん」にメガネをかけてもらったところ。レンズの屈折まで反映されている(hailuo AIで作成

 2024年、画像生成AIに起きたことを振り返ってみます。今年もすさまじいペースで物事が動きました。今年起きたことに注目するなら、高精細化と高品質化が進む一方、一貫性をいかに実現するのかがポイントでした。一貫性技術は、動画生成AI分野の拡大をもたらし、さらに、3D化の実現までも可能性として見せはじめました。それぞれの技術はお互いに影響を与えつつ、別々に進化し、より専門化が進んでいます。この連載によく登場してくる作例のキャラクター「明日来子さん」を通じて、どのように技術変化が進んだのかを見ていきましょう。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

同じキャラクターが出せるようになった

 まず、2023年12月に登場したクラウド型画像生成AIサービス「Midjourney」バージョン6で写真と品質的に見分けがつかないような画像が生成できるようになりました。それで作った「明日来子(あすきこ)さん」がこの連載に登場したのが1月です。現在、Midjouneyはv6.1にアップデートし、写真的な描写はさらに得意になっています。

何となく作った後に「明日来子さん」という名前をつけた作例(「“世界生成AI”到来か 画像生成AIのゲームエンジン化が進む」 より)

 画像生成AIにとって大きな課題点だったのは、人物などのキャラクターの首尾一貫性をどのようにして担保するかという点でした。生成AIの特性上、結果がランダムに生成されるため、同じ顔を繰り返し生成するのが難しいためです。Midjourneyは3月に、1枚の画像から特定のキャラクターを似せて生成できる「クリエイティブリファレンス」というコントロール系の機能を搭載しました。Stable Diffusionで登場した類似画像生成機能「IP-Adapter(IPアダプター)」に似た機能を、Midjourneyに実装し、より強力に出せるようにしたものです。完全にそっくりとはいきませんが、同じ人物に近い画像が出せるようになり、それを「アニメ風」「絵画風」など様々なタッチに変更して出力できるようになりました。

クリエティブリファレンスを使うことで、明日来子さんのオリジナル画像から、顔を似せたまま着物姿や別の表情を簡単に作れるようになった(「画像生成AIで同じキャラクターが簡単に作れるようになってきた」 より)

 その後、5月に敏腕開発者のlllyasviel(イリヤスフィール)さんがStable Diffusion向けに出したのが、画像生成時に照明効果をコントロールする技術「Imposing Consistent Light(IC-Light)」でした。これによって画像のバリエーションが出しやすくなりました。最初のバージョンはStable Diffusion 1.5ベースでしたが、10月には最新モデルのFlux.1に対応した「IC-Light V2」がリリースされています。

IC-Lightを使うことで、オリジナル画像(右)を逆光のようなライティング(左)を簡単に生み出せるようになった(「画像生成AIに照明革命 日本と世界で同時に“神ツール”登場」より)

 そして、6月に登場して業界に衝撃を与えたのが、Luma AIの動画生成AIサービス「Dream Machine」です。それまでの動画生成AIサービスには弱点がありました。人物の一貫性を維持できないという点でした。生成するとすぐに別の人に変わってしまうのです。この問題を、キーフレームという最初の画像と最後の画像とを指定することによって、途中で崩れるにしても、極端な崩壊が起きるのを抑制できるという方法です。この技術がきっかけで破綻の少ない動画を作れるようになりました。そして、動画生成AIサービス各社がこの機能をマネして実装してくるようになりました。

▲明日来子さんの画像を最初と最後に指定して生成したもの。途中の顔は完全に崩れているのだが、5秒間という短い間ならば、なんとかごまかせている(「AI動画の品質が仕事に使えるレベルになってきた」より )

 同じ6月に出てきたのがイラスト制作用AIツールのクラウドサービス「Copainter」。下書きからの線画作成、下塗りをしたものを着彩したりといったことを画像生成AI技術によって実現するものです。高解像度化や写真を漫画の背景画像に使えそうなものに変換したりと、その後も機能充実を続けています。技術に詳しくなくても使いやすいこともあり、漫画制作に生成AIを使う人達を中心に広がっているようです。イラスト作成ツールが生成AI分野に進出しない状況が続いているため、今後もその領域に広がっていきそうです。

筆者が、明日来子さんの画像を見ながら行った模写(左)、Copainterで線画作成したもの(中央)、さらに着彩をしたもの(右)(「イラストのペン入れと色塗り、AI使えばわずか1分」より )

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ