LCMでも追加学習「LCM-LoRA」登場
そんななか、11月9日、LCMについて同じくルオ氏が中心となって研究されたさらなるブレイクスルーを起こす論文が発表になりました。「LCM-LoRA」です。
LoRAは、画像生成AIへの追加学習を可能にするモデル形式のこと。Stable Diffusionの世界では一般的になっています。LCM専用の学習済みデータを再学習させてLoRAにすることによって、より簡単に扱えるようにしようという仕組みです。発表されたのは、「Stable Diffusion v1.5」「Stable Diffusion XL(SDXL)」といったバージョンの異なる画像生成モデルに適応できる3種類。これを組み込むことにより、LCMを汎用的に使うことができるようになります。
実際に、Stable Diffusionの代表的な動作環境である「ComfyUI」に組み込むことに成功できた報告も上がっています。ステップ数を5分の1で動作させることができるようになるため、生成速度は通常の状態に比べて4.8倍と5倍近くも速くなったそうです。もちろんビデオメモリーの少ないローエンドのPCでも使えると考えられます。
LCM-LoRAの普及が進めば、画像生成AIの基本環境はより扱いやすいものに変わる可能性があります。
シンプルな設定に、LCM-LoRAを組み込み、生成のスケジューラー設定を変更するという簡単設定だけで、生成速度は5倍に達したという(Xより)
这是生成的那个视频 pic.twitter.com/Lh56Gotakj
— 歸藏 (@op7418) November 10, 2023
▲AnimateDiffの生成も、投稿者の環境では16コマの生成にかかったのは7秒と劇的に短くなったと報告がなされている
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 -
第147回
AI
ゲーム開発開始から3年、AIは“必須”になった──Steam新作「Exelio」の舞台裏 -
第146回
AI
ローカル音楽生成AIの新定番? ACE-Step 1.5はSuno連携で化ける -
第145回
AI
ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う -
第144回
AI
わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった -
第143回
AI
AIエージェントが書いた“異世界転生”、人間が書いた小説と見分けるのが難しいレベルに -
第142回
AI
数枚の画像とAI動画で“VTuber”ができる!? 「MotionPNG Tuber」という新発想 -
第141回
AI
AIエージェントにお金を払えば、誰でもゲームを作れてしまうという衝撃の事実 開発者の仕事はどうなる? -
第140回
AI
3Dモデル生成AIのレベルが上がった 画像→3Dキャラ→動画化が現実的に - この連載の一覧へ





