このページの本文へ

新清士の「メタバース・プレゼンス」 第120回

ラフさえ描けばイラスト作品ほぼ完成 画像生成AI「FLUX.1 Kontext」LoRAが示す制作の未来

2025年08月18日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

LoRA学習の定番「AI Toolkit」に対応

 Flux Kontextについてはすでに一度紹介していますが(参考:「“一貫性”がすごい画像生成AI 冬服→夏服も一発変換 話題の「FLUX.1 Kontext[dev]」」)、こうしたLoRAが登場しやすくなったのは、“Ostris”こと、ジャレット・バーケット(Jaret Burkett)さんが開発を続けているLoRA学習の定番環境の1つ「AI Toolkit」がFlux Kontextに対応したためです。このツールはこれまでもSDXLやFlux.1 [dev]に対応しています。

 これまでのLoRA学習と大きく違っているのは学習データです。これまでは特定画像だけでよかったのですが、“変化前”とするインプットデータと、“変化後”にしたいターゲットデータのペア画像を20~50組ほど用意する必要があります。筆者の場合、30組を使用しています。かつ、ローカルPCで実行する場合にはVRAM 24GB以上が必須とされているため、要求スペックは高めです。

 ただ、従量課金制のクラウドサービスのfalが対応しており、LoRA学習の一定の成果が出るとされる2000ステップが6ドル(約900円)程度で利用できます。手軽さもあり、多くのLoRAはこのクラウド環境を利用して作成されているようです。gokaygokayさんは実際、掲示板サイトのRedditに21種類のLoRAを公開しました。アニメ風、鉛筆風、オイルペイント風など様々な画風LoRAが公開されていますが、いずれもfalの環境で制作されたようです。

 LoRAはもともと、特徴のある画風だけをまとめたデータを集中的に学習することで、基盤モデルの出力結果を一定方向に引きずることを可能にする技術です。もちろん、基盤モデルが優秀であればあるほど、LoRAに対しても敏感に反応します。たかだか数十枚の画像データであっても、かなり精度の高いLoRAを制作できることは、Flux Kontextの性能の高さを物語っているわけです。

gokaygokayさんの公開しているLoRAを使ったもの。オリジナル画像は右下のフィギュア風画像。水彩画風(左上)、ミニマリスト風(右上)、ポップ・アート風(左下)

カテゴリートップへ

この連載の記事
ピックアップ