このページの本文へ

新清士の「メタバース・プレゼンス」 第155回

非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話

2026年05月04日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

ほしかった画像&動画生成AIツールが完成

 作成してみて、大きく気がついた点があります。UIを追加したことによって、体験が大きく変化したことです。筆者がつくった機能は基本的に、ComfyUIでできる機能をWebUIに落とし込んだラッパーに過ぎず、1つひとつの機能はComfyUI上で実行できます。しかし、その理解はややこしく、設定は面倒くさく、機能の切り替えはとても手間です。ところが、UIにすることで、DXが変化し、操作全体が簡単になり、試行錯誤が劇的にやりやすくなりました。そうすると、あれもこれもと実験したくなってきて、Z-Image Turboを使った画像生成の量が劇的に増えました。

 画像AI用のWebUI環境には「A1111」や「Forge」など様々なものが登場してきました。特に、SDXLの人気を現在も支えているのは、手軽に扱えるこれらの存在が大きいと言えます。しかし、複雑化する環境のなかで保守が停止し、最新のモデルには対応していないので、それらを使うには複雑なComfyUIの利用が必須になっており、それが導入をためらわせる十分な理由になっています。

 筆者自身も、ビューアーにも生成環境にも不満を抱えていたのですが、AIの発展によって、プログラム経験がほぼない筆者自身が「WebUIを開発することになるとは」と、なにか異様なことが起きていると感じています。

 さらに、動画生成の機能も追加していきました。動画モデルのLTX-2.3のカスタムノード「WhatDreamsCost」を使って、複数枚の画像からアニメーションを生成できるような仕組みの整備を進めました(参考:LTX-2.3の無料でここまで?動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか)。

 これもサンプルのWorkflowと、過去にすでに生成に成功している動画のメタデータをClaude Codeに読み込ませ、そこから解析させて実装を進めていきました。ビューアーから画像を選択できる機能や、LM Studioを使って複数の画像を自然につながるように解釈させるプロンプトを作らせる機能などを作成していきました。

 筆者の環境は、メインで使っているPC以外に、動画生成などの重い作業をさせるRTX 4090搭載PCがあるのですが、そちらにLAN経由で指示を出し、制御する仕組みも作りました。そちらでもComfyUIを立ち上げておけば、ネットワーク越しにスタジオから指示を出し、動画生成をしてくれるのです。終了後の結果の動画は、自動的にスタジオのビューアーに追加されます。

 つまり、百夜スタジオは単なるビューアーから、生成・管理・プロンプト変換・動画生成までを一体化したコンテンツパイプラインを持つ個人用制作環境へと変わっていったのです。

LTX Dreamモードでは、複数の画像を登録して、プロンプトを作成すると、それに合わせて動画が作られる

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ