イラストのペン入れと色塗り、AI使えばわずか1分

2024年07月08日 07時00分更新

文● 新清士　編集●ASCII

画像を分析する「タグ生成」のステップが入っていると考えられる

　copainterがやっていることは、画像生成AI「Stable Diffusion」を使ったimage2image（i2i）だと考えられます。i2iで画像を線画にする方法は、LoRA（追加学習機能）が本格的に普及してきた2023年の早い時期から存在していました。

　ただ、完全な線画にしたり、画風を元画像に近いものにすることが難しかったりと、コントロール面に課題を抱えていました。また、下絵のようなものをキレイに整えるといったことは簡単ではなかったんです。顔が変わってしまったり、よけいなものが色々と入ってきてしまったり。それがcopainterではかなり調整されていて、できるだけ元画像を活かすようにクセがない出力結果になるように調整されていて感心します。

　なお、copainterは「犬の画像を入れると破綻する」という噂がありました。なぜそのようなことが起こるのかは、技術情報が公開されていないので若干の推測が入りますが、生成手順を理解するとわかります。

　まず、画像を生成する前に、その画像を分析して何が描かれているかを判断する「タグ生成」のステップが入っていると考えられます。このタグ解析の方法はデータがオープン化されていて、画像生成用のアプリ「Stable Diffusion WebUI A1111」でも拡張機能として利用可能です。このタグ情報をプロンプトとして利用することで、生成画像時の精度が高まります。生成された画像から予期していなかった版権物が生成されたという報告は出ていないことから、版権物のタグは生成されないように調整されていると考えられます。

A1111の拡張機能で筆者の模写をタグ解析した例。「1少女, グレースケール, モノクローム, ソロ, イヤリング, 笑顔, 宝石, スケッチ, 見る人を見る, シンプルな背景, 長い髪, 白い背景, ジャケット, 閉じた口, 上半身」（解析後のプロンプトを翻訳）

　破綻するケースですが、元となる画像にタグ付けを付けるタイミングで、「犬」と認識しつつ、「女性」と認識できず、プロンプトに人間が入らなかったような場合に起こります。ただ、筆者も同じような画像を作成して試してみましたが、タグ解析を突破するのはなかなか難しく、元画像のキャラの不透明度を30%にして初めて成功しました。同じ画像をA1111に入れてタグを解析させてみると、女性のキャラが存在することを認識できないことが確認できます。

犬の画像を追加して、ペン入れをしてみたもの。上は通常のまま、下はキャラクターを不透明度30%に設定してみたもの。左下は線が薄いために人物が認識できておらず、犬が生成されている。A1111でタグ解析をすると「犬, 人間なし, ソロ, シンプルな背景, 白背景, 舌, 首輪, ジュエリー, 動物, 見る人を見る, モノクローム」（翻訳）となった

　つまり、背景の色を意図的に薄くするなどして“犬”の要素を極端に強調するといった、まれなケースでないと難しいのだろうと考えられました。元画像が何を意図しているのかわかりにくい画像を読み込ませれば、適切なタグがつかなかったり、謎のカエルのケースのように、意図しているものとは違う画像になります。これは画像生成AIの特性でもあり、破綻を目指した利用を想定した設計になっていないので起きることです。

　ちなみに料金プランは月額680円のライトプランではで50回分チケットですが、全然足りません。

　画像生成AIを利用すると、1回でベストな画像が出ることは少なく、ちょっとずつパラメーター変えての試行錯誤をして、最も良い結果を探るのが普通です。さらに、着彩も同じように試すことになるので、1枚の優れた結果を出すために6枚ぐらいを使うことになります。ページ数のある漫画を描くといった目的で、本格的に使うには月額1980円の300回分チケットはすぐに必要になってくるでしょう。

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

AI

イラストのペン入れと色塗り、AI使えばわずか1分

画像を分析する「タグ生成」のステップが入っていると考えられる

この連載の記事

AI
AI動画の品質が仕事に使えるレベルになってきた

AI
AIが作る3Dモデルの完成度が上がってきた　毎回異なるモンスターが生成されるゲームも実現か

AI
“革命”起こした画像生成AIに暗雲　「Stable Diffusion 3 Medium」の厳しい船出

AI
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ

AIオススメ記事

画像生成AIの進化が早すぎる　2024年に起きたことまとめ

人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク　初心者にオススメ

動画生成AI、無料プランでも使い倒せば月200本作れます　サービス同士の違いも比較しました→Runway、Pika、Hailuo、Kling、Luma、Kaiber、PixVerse

AI、人間超えた説　OpenAIの従業員が「AGIを達成した」との見方示す

【速攻解説】OpenAI「Sora」の使い方　月額3000円で出来ること、出来ないこと

OpenAI「Sora」残念な離陸　中国勢が飛躍する動画生成AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃

X、AI「Grok」無料で試せるように　写真みたいな画像も生成できる

もはや実写と間違えるレベル　動画生成AI「Runway」の進化がすごい

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ

ピックアップ

XMP 3.0に対応した「Crucial Pro DDR5-6400」が抜群の安定感だった

Ryzen 7 9800X3Dで高性能ゲーミングPCを組みたいならX870マザーボードは耐久性能と程よい価格で選べば間違いなし

業界最安値級から2万円引き!? 普通に買うよりお得・手ブラでPCが組めるアプライドの自作イベント

【今売れているゲーミングPCのスペックはコレ！】「G TUNE」で見る最新ゲーミングPCの最先端

約2.6万円のパープル200Hzゲーミングディスプレー、女性的にはアリ？盲牌でわかるボタンとは？

黒くてデカいデスクトップパソコンは不要！在宅ワークこそエレガントに効率アップを狙える「Lenovo IdeaCentre Tower 14IRR9」だ

いまゲーミングノートを選ぶなら“薄軽”が必須条件、Ryzen AI 9とRTX 4060搭載の最新「ROG Zephyrus G16」

より幅広い健康管理が実現！ファーウェイ製スマートウォッチに無料で加わる心電図（ECG）測定機能を試す

あれもこれもASUS！新ピラーレスケースも渋カッコいいBTOPCのコダワリを聞く

ランサム感染の実体験からMDR導入事例までが語られた「Canon Security Days 2024」

実家・ホテル・コタツでゲームしたいなら、Ryzen 7とRTX 4060のLEVEL∞15.6型ノートPC

ゲームの世界にいるみたい！没入プレイしたいなら大画面の湾曲ゲーミングディスプレーがおすすめ

Backlogの利用をチーム内で定着させたい？初歩のノウハウをまとめます

“アラート疲れ”で担当者がサイバー攻撃を見落とす！どうやったら防げた？

狭い机でも縦置き／横置きどちらもOK！高性能な小型デスクトップパソコンでノートPC以上の作業効率アップを狙う

バッテリー長持ちのスマートウォッチで2025年こそ健康的な生活！クリスマスプレゼントに合う製品を紹介！

144Hzで21：9の3840×1600ドット37.5型ウルトラワイドディスプレー、ゲームの没入感や仕事の効率アップがスゴイ

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

イラストのペン入れと色塗り、AI使えばわずか1分

画像を分析する「タグ生成」のステップが入っていると考えられる

この連載の記事

この記事の編集者は以下の記事をオススメしています

AI AI動画の品質が仕事に使えるレベルになってきた

AI AIが作る3Dモデルの完成度が上がってきた 毎回異なるモンスターが生成されるゲームも実現か

AI “革命”起こした画像生成AIに暗雲 「Stable Diffusion 3 Medium」の厳しい船出

AI 危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ

AIオススメ記事

ピックアップ

AI
AI動画の品質が仕事に使えるレベルになってきた

AI
AIが作る3Dモデルの完成度が上がってきた　毎回異なるモンスターが生成されるゲームも実現か

AI
“革命”起こした画像生成AIに暗雲　「Stable Diffusion 3 Medium」の厳しい船出

AI
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ