LoRAはWebサービスを使えば2ドルで作れる
「明日来子さんLoRA」はどうやって作ったか。
そもそも、明日来子さんのデータは2024年1月、この連載のためにMidjouneyで作成した1枚の画像しかありませんでした。そこで、3月に追加されたMidjourneyの「Creative reference(Cref)」の機能を使い、1枚の画像から1024x1024の画像サイズで派生画像を作っていきました(参照:画像生成AIで同じキャラクターが簡単に作れるようになってきた)。
キャラクターのシチュエーションのプロンプトは、やはりMidjouneyの画像解析機能の「Describe」を使って作成しています。Midjourneyは、7月にバージョン6.1が公開されて、美的に優れた表現が強くなりましたが、Cref機能を使うには旧来のバージョン6を使ったほうがより似た顔が出やすい印象です。
Crefを使ってもまったく同じ顔にはならないので、「明日来子さんっぽい」と思える画像を選んでいきます。LoRA作成に必要な枚数は10枚以上ですが、多めにと36枚を選別して学習データとしました。そこから、LoRAを作成するクラウドサービスに入れて学習を実行していきます。
FLUXの一般向けモデル「FLUX.1 dev」用のLoRAを作成するには、学習に最低でもVRAM 24GBのGPUが必要です。そのため、生成AI系のクラウドサービスが一斉に、FLUX用LoRAの生成環境をサービスとして提供しはじめています。学習データが20~30枚程度であれば30~40分で学習可能ということもあり、設定が簡単なクラウドサービスを使うメリットがあるわけです。
たとえば、CivitAiは、1回2ドルでFLUX.1 dev用のLoRAトレーナーのサービスを提供しています。専用の解説ページを作ったり、FLUX.1 LoRAのコンテストを始めたり、新サービスとして売り込もうと頑張っているようです。LoRAトレーナーでは、最大1000枚までアップロード可能。画像のキャプションはLLMで自動解析してつけてくれます。1回の生成費用は2000Buzz(CivitAI内の仮想通貨で2ドルに相当)です。
一方で、筆者が利用したのは「replicate」というサーバレンタルサービスです。利用時間に応じて、使用料が求められるというもの。公開されているサーバー用に設定されているスクリプトを利用できる仕組みです。動かすにはHuggingFaceのAPIキーが必要だったり、実際にいくら料金がかかるのか、生成終了後に手計算しないとわからないという難点があります。今回テスト的に使ってみたのですが、明日来子さんLoRAの生成にかかったのは約30分で、使用料は約2.5ドルでした。
この連載の記事
-
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって -
第73回
AI
AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック -
第72回
AI
人が絵を描く“工程”をAIで再現 タイムラプス風動画が炎上した「Paints-Undo」 -
第71回
AI
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ -
第70回
AI
イラストのペン入れと色塗り、AI使えばわずか1分 - この連載の一覧へ