このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第120回

ラフさえ描けばイラスト作品ほぼ完成 画像生成AI「FLUX.1 Kontext」LoRAが示す制作の未来

2025年08月18日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

CoPainterで同様のことができる可能性

 筆者のLoRAは、画像生成サービス「CoPainter(コペインター)」から着想を得ています。7月末に配信された線画機能のアップデートでは、2種類のモデルが登場しました。ラフ画像を入力画像として、「V2(soft)」は大幅に絵を変換しつつ、「V2(hard)」は元画像に忠実に、それぞれ整った画像(線画)に変換してくれるというものです。このサービスは何の生成AIを使っているのかは明らかにされていませんが、この機能はFlux Kontextを利用していると筆者は推測しています。

 Flux Kontextは、量子化(圧縮)モデルでも、VRAMが8GB以上とそれなりにスペックが求められるため、環境整備にハードルがあります。それに対し、CoPainterはクラウドサービスで環境を選ばず、また、値段も50枚の月567円と比較的安価なので、手軽に使いやすいという強みがあります。今は1種類の画風でしか出せませんが、将来的には、様々な選択肢が登場したり、ユーザー自身の画風に寄せた結果を生成できるようになっていくのではないかと考えています。

筆者のラフをCopainterで出力したところ。精度高く線画が出ている

ラフさえ描けば“ほぼ完成” アニメにも応用可能か

 一方で、公開されているFLUX.1 Kontext [dev]には限界もあります。弱点は軽量化された「蒸留モデル」であるということです。APIを通じてのみ利用できる非公開の[pro]モデルを軽量化したのが [dev]モデルです。しかし、蒸留を通じて、パラメーターが減少した結果、学習に素直に反応しない部分が出ていることが起きているようなのです。

 典型的なのは、複数枚の画像の意味を同時に理解させるような学習をしても、成果が出にくいという点です。「FramePack」に比べて学習させにくいといった意見も出ています。

 それでも、筆者が一連の作業を通じて感じたのは、ラフと完成画稿とのペアを多く持つ人にとっては自分LoRAを作成することで、様々な応用範囲が広がりそうだということです。ラフ状態の画像から、完成に近い画像を作成できる可能性があるわけです。これはイラストやマンガ制作だけでなく、制作の速度が求められるアニメ分野にも応用可能な技術ではないでしょうか。

 これまで、やはり同様のことはSDXLでも試されているのですが、十分な品質が足りず、必ずしもうまくいっていませんでした。こうしたことがAIの技術革新を通じて、1つひとつ乗り越えられているのです。

   

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ