11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。
なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェーデン語でクレヨンの意味だそうですが、これにとにかく衝撃を受けたんです。生成AIとペイントソフトの組み合わせは、この形が世界のデフォルトになるなという印象を持つようになりました。
Krita
https://krita.org/en/
無料のペイントソフトに革新的な生成AI機能が追加された
Kritaはオランダに拠点を置く財団が開発を続けているオープンソースのフリーウェア。Linuxの世界での派閥争いのなか、オープンソースの画像編集ソフト「GIMP」のGNU GPLとケンカしたことで開発されることになった、互換用のお絵描きソフトだそうです。
なので、開発が始まったのはもう18年前。世界的に普及したというほどの人気のソフトでなく、アップデートも緩やかでした。UIなどは日本語化されていますが、日本国内ではあまり知られていないアプリと言っていいでしょう。
ところが、今年に入ってプラグインという形で生成AI系のアップデートが追加されたことで注目を集めているのです。
9月に発表されたプラグインが「Generative AI for Krita」。Adobe Photoshopの「生成塗りつぶし」に近い機能で、画像を選択してプロンプトを入力すると、指定の画像が生成されるというものでした。たとえばフクロウのラフを描き、ラフで描いた構図にもとづいてフクロウの絵を生成することもできます。特定の画面領域を指定して、人物のポーズを解析する「OpenPose」機能を使い、レイヤー単位で人物を合成するなどもできました。
▲フクロウのラフ画を元に、フクロウを生成するデモ
▲何もないところに絵を描いて、そこにキャラクター2人が剣で戦っているところまでの作成を見せているデモ
直感的な操作感が「これは良いね」と少し話題になりましたが、画像生成AI「Stable DIffusion」を実行環境「WebUI」で起動し、拡張機能を使えば同じようなことを実現する方法が開発されていました。それにまあPhotoshopでも似たような機能がすでに開発されてきているしねえ、というくらいに受け止められていたんです。
ところが、11月に新搭載されたリアルタイム生成機能(ライブペインティング機能)が、まあとんでもないものだったんです。最大の違いは、描いているものに応じて、リアルタイムに生成画像が反映され変化していくという点でした。
この連載の記事
-
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは - この連載の一覧へ