1/GPT4oとプロットを作る
いつものように、漫画のシナリオ、ネームを考えます。今回は「金の斧銀の斧」をベースに、恋愛させつつGPU交換を終わらせます。
GPT4oがリリースされたので、早速一緒にプロットを作ってみました。前よりも頭が良くなって、指示が通りやすく、答えのレベルも上がりましたね。
最初からガチガチにプロンプトを組むより「漫画のプロットでこんな話考えてるんだけど、貴方ならどんな風に内容をまとめる?」とフランクに聞いて、何度もラリーをします。
どんな事でも行動を始める時は腰が重いものですが、このやり方であればあまり気負わず、自然に頭をプロット作業モードに移行できて便利です。GPT4oは自分にとって「思考の潤滑油」。AIの返答をそのまま採用する事はあまりなく「自分の考えをまとめるためにAIに話を聞いてもらう」という使い方をしています。
そして、GPT4oはテンプレート的な回答が上手いです。自分の考える話に近いテンプレートを何個も出してくれます。そのテンプレートを使えばいいのか! という気づきも多く、GPT4oを使用した時の方が、確実にプロットの質が上がります。
2/AIモデルの選定
2024年6月現在、少女漫画風の生成に一番向いているAIモデルはおそらくniji・journeyですが、こちらは前回お話した通り自分は商業で安全に使用できる自信がありませんので、今回も前回と同じく、商用可能ライセンスのSDXLアニメ系AIモデル複数を使い分けて作っていきます。
3/画風調整コピー機LoRAモデルの選定と数値調整
LoRAについては前回も書きましたが、今回使用するのは画風調整用の「コピー機LoRA」と呼ばれる学習方法で作られた特殊なLoRAです。
その名称から、他人の絵を丸々コピーするもの? と思われるかもしれませんが、実情は全く違います。
まずAIモデルに一つの絵を過学習させ、その絵しか出ないモデルを作ります。
この一つの絵は何でもいいです。最適なのはそのモデルが生成したAI絵です。
そのAI絵を加工してさらに過学習させて差分を抽出し、差分のみを適用するLoRAを作る。それが「コピー機学習LoRA」です。
文章だと何を言っているのかよくわかりませんよね。実際にコピー機学習を試されている方がおられますので、そちらのスレッドをご覧ください↓
「1枚の絵から作る自分絵線画LoRA」に興味がある人へ
— とりにく (@tori29umai) May 29, 2024
一枚目の画像を2枚目みたいに自分の絵柄でトレスしていただけないでしょうか?
この手法が確立できたらかなり面白いと思うので
学習に時間がかかるので先着5名程度になると思いますが、実証実験協力してもいいよーという方はぜひお願いします! pic.twitter.com/dWyhnKwBC9
このように、1枚の自分の絵から高品質な「自分絵LoRA」が作れるという優れた技術です。自分で画像に加筆や加工をした部分だけを学習するため、コピー機学習法で作ったLoRAであれば、特定作家さんの画像集中学習などで懸念される著作権の問題などもありません。感覚的には、クリスタで言う「フィルター」に近いものです。
今回はこれと同じ要領で作られた下記LoRAを使用します。
・sdxl2-flat2(書き込み量調整)
・test-sdxl-lineart-11(白黒線画化、及び線の抑揚が消える)
・sdxl-bold(線の太さ調整)
調整用コピー機LoRAなし、素のモデルで出した絵がこちら。
この画像に上記3つのLoRAを数値を調整して適応すると、こうなります。
調整LoRAのみでここまで画風が変えられるってすごいですよね。素のモデルの絵と比べると、かなり少女漫画風な絵になったのではないでしょうか。
この他にも「目の大きさ調整」「顔の長さ調整」なども出来るため、調整LoRAだけで色々な画風に変更が可能です。
現時点で1枚の自作加筆絵からこれだけの事が出来る事実は、もっと注目されていいのではないでしょうか。コピー機LoRA学習法で、自分で誰かの絵をそっくり真似した絵を1枚だけ作れば、結構な再現度で他の方の画風を真似る事もできるわけです。それは手描きの模倣と全く同じ事であり、誰かの画像を集中学習しているわけでもないので、著作権違反にもなりません。
何を問題とし、何を問題としないのか。モラル的な問題も含め、その線引きが今まで手で絵を描いてきた時の感覚とはかなり変わるな、と肌で感じています。自分も時代の新しい流れに溺れないようにするのがやっとです。
今後一層「生成物での議論」が重要になってくるでしょう。
(次ページ:線画に色を塗っていきます)