マイクロソフトの攻勢と「LCM」革命
10月に入ると、マイクロソフトが突如、Bing上で画像生成AI「DALL·E 3」の無料利用を開始。DALL·E 3はStable Diffusionと制御方法が異なり、非常に精度が高いと大きな話題になりました。「AI生成の女の子はラーメンを食べられない」という話題は過去のものになりました(笑)。
さらにChatGPT(有料版)にもDALL·E 3が搭載され、「GPT-4V」による画像の解析と相まって利用者が増えました。ただし生成物が著作物に近づいているので、プロンプトや生成物にフィルターを掛けて、「そのままズバリ」は出さないというアプローチを取っています。
マイクロソフトは今後、「PowerPoint」にDALL·E 3を採用するとアナウンスしていて、既にWindows 11の「ペイント」には追加されました(ただし日本は未公開)。マイクロソフトはOpenAIとの提携を通じ、Windowsに標準搭載する機能として生成AIを普及させようとしています。
そして11月に入って、革命的なことが起きたのが高速生成技術「Latent Consistency Model(LCM)」。これによってリアルタイムで画像が生成できるようになり、動画のようにAI生成物を使う「ストリーミングLCM」というものさえ出てきました。先日、Stability AI側もやはり独自の高速化技術を使った「Stable Diffusion Turbo」を発表してきています。
今後はLCMを含めて、いかに動画生成AIをコントロールするかに焦点が当たることになると思います。RunwayなどはすでにInpaintに組み込んだツールを出していますが、ユーザーが意図したとおりの動画を生成するために、いかにAIのランダム性をコントロールできるようにするのかという競争が来年にかけて続いていくことでしょう。
この連載の記事
-
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって - この連載の一覧へ