このページの本文へ

新清士の「メタバース・プレゼンス」 第159回

AIを使える人と使えない人で、とんでもない差が出ると実感した理由

2026年06月01日 09時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

LoRA作成用の素材を量産する

 田中さんのアニメ画像を夏っぽい一定の服装に固定し、もう少しイラストらしい印象にすることを目的として、LoRAを作ることにしました。すでにAnimaを動作させるComfyUI環境は構築済みだったため、そこを利用して、基準となる画像を4枚ほど生成するように指示しました。その確認後、LoRAへと発展させることを前提に、コアとなる共通プロンプトを使って、その差分のバリエーションを50枚作るように指示しました。

 さらに、その画像群からLoRA構築に向いていると思われる画像をピックアップさせて、25枚のセットにします。

基準となる画像。このプロンプトやポーズもCodexに考えさせ、画像の生成まで実行させている

CodexがAnimaで生成した50枚の画像を整理したコンタクトシート。キャラクターLoRA化を前提に、正方形で背景を白にしている。このシートもCodexが自動で作成してくれる

Codexとの生成のやりとり

 ただ、同じような微笑みの表情ばかりだったので、もう少し表情差分があったほうがよいと考え、表情差分を追加で20枚生成するようにも指示しました。服や構図を固定し、表情だけを変えたバージョンをCodexが作ってきました。

 合計で45枚の画像ができましたが、その内容をチェックさせたところ、「このキャラLoRAなら、25枚で体型・服・全身、20枚で顔と表情、かなりバランスいいです」との返答があったので、これをデータセットにするため、キャプション付けの作業をします。LoRAの作成には、画像と、その内容を説明するテキストファイル(txt)の2つのペアを20~50枚用意する必要があります。その作成には、自動タグ付けアプリなどを使うこともありますが、その作業もCodexがすべてやってくれます。Animaに認識させやすいようにといった条件をつけることで、どのようなプロンプトが効きやすいかまで調べ、各ファイルの画像を解析した上で、その条件に合ったタグ付けをしてくれます。

表情差分20枚のコンタクトシート

生成されたタグの例。冒頭に筆者が指定したトリガーワードがある

用意した素材から実際にLoRAを作る

 次に、実際にLoRAを作成します。筆者はLoRA学習にNVIDIA RTX 4090搭載のサブPCを使っているため、メインPCからデータ転送したあと、円滑に実行させるための指示書をCodexに作成させます。そして、サブPCのCodexにその指示書を読み取らせ、実際に生成作業をさせます。

 そして、追加で何も指示することなく作業は進み、CodexがAnima Standalone Trainerを操作して1時間半後にできあがってきました。設定の違いを吸収する作業や、途中できちんと進んでいるかを監視する作業、終了後のサンプル画像の作成まで、すべて自動で実行されます。

 全体で3000ステップ(ステップは学習を繰り返した回数)の学習をしましたが、1000〜2000でも十分と考え、4パターンの画像を作らせて比較もしてみました。その結果、1500が一番効果が高いと判断し、それを使うことにしました。次回以降は、生成に必要な時間は、30分あれば十分でしょう。

 そして、これらのAnima LoRAの作成手順「SKILL.md」としてCodexにまとめて保存させておきます。Skillは「特定の作業をするときにCodexへ読み込ませる専門手順書」です。Anima LoRAの作成手順をまとめることで、次回以降、このSkillを呼び出すだけで、さらに簡単かつ、迷うことなくCodexを通じたLoRA作成ができるようになります。

実際にLoRAを生成した際のCodexの画面

Codexがまとめた、プロンプトの違いや、各学習段階のコンタクトシートの違いの比較

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ