LoRAはWebサービスを使えば2ドルで作れる
「明日来子さんLoRA」はどうやって作ったか。
そもそも、明日来子さんのデータは2024年1月、この連載のためにMidjouneyで作成した1枚の画像しかありませんでした。そこで、3月に追加されたMidjourneyの「Creative reference(Cref)」の機能を使い、1枚の画像から1024x1024の画像サイズで派生画像を作っていきました(参照:画像生成AIで同じキャラクターが簡単に作れるようになってきた)。
キャラクターのシチュエーションのプロンプトは、やはりMidjouneyの画像解析機能の「Describe」を使って作成しています。Midjourneyは、7月にバージョン6.1が公開されて、美的に優れた表現が強くなりましたが、Cref機能を使うには旧来のバージョン6を使ったほうがより似た顔が出やすい印象です。
Crefを使ってもまったく同じ顔にはならないので、「明日来子さんっぽい」と思える画像を選んでいきます。LoRA作成に必要な枚数は10枚以上ですが、多めにと36枚を選別して学習データとしました。そこから、LoRAを作成するクラウドサービスに入れて学習を実行していきます。
FLUXの一般向けモデル「FLUX.1 dev」用のLoRAを作成するには、学習に最低でもVRAM 24GBのGPUが必要です。そのため、生成AI系のクラウドサービスが一斉に、FLUX用LoRAの生成環境をサービスとして提供しはじめています。学習データが20~30枚程度であれば30~40分で学習可能ということもあり、設定が簡単なクラウドサービスを使うメリットがあるわけです。
たとえば、CivitAiは、1回2ドルでFLUX.1 dev用のLoRAトレーナーのサービスを提供しています。専用の解説ページを作ったり、FLUX.1 LoRAのコンテストを始めたり、新サービスとして売り込もうと頑張っているようです。LoRAトレーナーでは、最大1000枚までアップロード可能。画像のキャプションはLLMで自動解析してつけてくれます。1回の生成費用は2000Buzz(CivitAI内の仮想通貨で2ドルに相当)です。
一方で、筆者が利用したのは「replicate」というサーバレンタルサービスです。利用時間に応じて、使用料が求められるというもの。公開されているサーバー用に設定されているスクリプトを利用できる仕組みです。動かすにはHuggingFaceのAPIキーが必要だったり、実際にいくら料金がかかるのか、生成終了後に手計算しないとわからないという難点があります。今回テスト的に使ってみたのですが、明日来子さんLoRAの生成にかかったのは約30分で、使用料は約2.5ドルでした。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ








