このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」第155回

非エンジニアが数百万円級のツールを開発　画像＆動画生成AIツールがゼロから作れた話

2026年05月04日 07時00分更新

文● 新清士

ビューアーを“AI生成スタジオ”に発展

　次の段階では、単なるビューアーだけでなく、ComfyUIをサーバとして動かし、連携させることで、画像生成機能を追加し、「スタジオ」として発展させることにしました。画像モデル「Z-Image Turbo」の環境で画像を生成し、さらには、動画モデル「LTX-2.3」を組み込んで動画生成もできることを目指しました。

　生成自体の機能追加は比較的簡単にできました。すでにZ-Image Turboで生成できた画像があるため、メタデータをClaude Codeに読み込ませるだけでWorkflowの再現ができるためです。それをスタジオに組み込むように指示すればよいだけです。

　狙って追加した重要な機能が、LLM連携で簡単な日本語を入力すれば、そこから内容を膨らませて、自然なプロンプトとして使用可能な英文への変換機能です。Z-Image Turboは、日本語を認識するのですが、より精度高く理解させるには英語か中国語がよいとされているため、英語化するようにしたのです。もちろん、それらのプロンプトはテクニックガイドを参考に、その方針に沿った文案を出してくれるようにとも指示しています。

　また、画像をドラッグアンドドロップすると、その画像をプロンプトに再解釈して分解してくれる仕組みも入れました。これで精緻な自然文が求められる最近の画像モデルに複雑な指示ができるようにもなりました。これで、当初目標としていた、Claude Codeを使ってのトークンを消費するプロンプト生成は必要なくなりました。

　さらにはControlNetやLoRAの呼び出し機能、特定のキャラクターを出しやすくするための保存機能、カメラワークや服装などのプリセット追加機能などを追加していき、1週間程度でWebUI環境としては一通りの機能が揃ってきました。

百夜スタジオの画像モード。ControlNetやLoRA入力にも対応。使用したプロンプトは、プロンプト生成エリアで作ったもの

プロンプト生成エリア。下段の日本語を入力後、英語化すると、適当に膨らませて、自然文のプロンプトに対応。SDXL用では、タグとして出力される

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事

トピックス
サムスン電子でスト懸念、在韓米商議所が声明　半導体供給網への影響を警戒　海外報道
AI
グーグル、超リアルな動画生成AI「Gemini Omni」発表か　海外報道
トピックス
マネーフォワード、停止中の銀行口座連携を順次再開へ
トピックス
くら寿司アプリに脆弱性　通信内容が盗聴・改ざんされる恐れ
トピックス
ソニー、TSMCと画像センサー新工場で提携へ
トピックス
イオンモール、個人情報流出か　外部クラウドサービスへの不正アクセスで

AIオススメ記事

2026年05月21日

AI

月額780円→0円！グーグル、月額2900円のAIプランで「YouTube Premium Lite」を無料に
2026年06月08日

AI

寝不足になるほど面白い　ローカルAIと音声合成をつないだら、キャラが普通にしゃべり始めた
2026年05月18日

AI

AIだけでゲームは作れるのか？ Codexに7本作らせて見えた実力と限界
2026年05月25日

AI

SDXLの次はこれ？　アニメ特化のローカル画像生成AI、驚きの実力
2026年06月01日

AI

AIを使える人と使えない人で、とんでもない差が出ると実感した理由
2026年05月15日

Team Leaders

ChatGPT、Claude、Gemini（NotebookLM）同じテーマでスライドを生成させたら、どの生成AIがいちばん使える！？
2026年05月11日

AI

ChatGPTの画像生成AIは本当に最強か　Nano Bananaと比べて見えた“弱点”
2026年06月10日

Team Leaders

生成AIへの入力が情報漏洩を招く！？　【要確認】ChatGPT、Gemini、Claudeへの入力内容を学習されない設定方法
2026年06月09日

AI

グーグル「Google AI Plus」、月額1450円と月額725円のプランが同時存在する事態に　ストレージ容量も違うので注意
2026年05月28日

sponsored

Core Ultra 9で23時間駆動、2in1スタイルを13.9mmに凝縮！タッチペンが底面に収納できる良コスパのビジネスノートは投資に見合う有力候補だ

ピックアップ

sponsored
6月4日から7日まで開催された「MSI 40th Anniversary Exhibition」に行ってきた

5人のエンジニアから始まったMSIが40周年！歴史から最新技術まで詰まった展示会が楽しかった！
sponsored
Core i5搭載のマウスコンピューター「mouse SH-I5U01（ホワイト）」が只今セール中

【2万円オフ】長く使える高性能スリムPCは今が買い！白の筐体がPCデスクに映えるのが◎
sponsored
マウスコンピューター「mouse B5-A7A01SR-A（Copilot+ PC）」

【32GBメモリー標準搭載】Ryzen AI 7に2560×1600の15.3型液晶、高性能で長く使えるノートPCが3万円オフのセール中
sponsored
ESET PROTECT MDR LiteとID Entranceの連携で実現する、盗まれたアカウント情報の悪用防止

EDR単体では防げない“セキュリティのすき間”を狙う新しい攻撃　IDaaSとの連携機能で守りを固める
sponsored
Zoomコミュニティリーダー・OTSUNAGI 茂木優弥氏

「ウェビナーにしか興味がない男」がZoom公認リーダーに　コミュニティから始める“日本企業のウェビナー変革”
sponsored
Zoom Webinars Plus導入事例：OTSUNAGI株式会社

集客数が最大2.5倍に！ウェビナーのプロがおすすめするZoomの「疑似ライブ配信」活用法
sponsored
フルHD・4K・4K Plus・5K・6Kのディスプレーで検証

4K Plus・5K・6Kの“4K超え”ディスプレーはどのぐらい精細なの？アップルのStudio Displayよりもはるかに安いモデルで比較してみた
sponsored

『プラグマタ』を超美麗画質で楽しめる性能を1.58kgの軽量ボディーに詰め込んだ、超モバイルノートだ！　「ROG Zephyrus G14 GU405AR」2026年モデル
sponsored
取引先の信頼を失わないためには「実効性のある運用」までが大切

SCS評価制度、“形だけの★3取得”が招いた取引停止の危機　どうやったら防げた？
sponsored
OneDriveを活用し“月額150円／ユーザー”の低コスト、安全な設定のままで使える

脱PPAPでも残る課題　社外への大容量ファイル転送は「GUARDIANWALL FT365」で実現
sponsored

Ryzen X3Dシリーズならメモリー1枚挿しでもゲームで十分な性能は出せる？
sponsored
低コスト／使いやすい／安心できる“現場の目”、LINE WORKS×ソフトバンクが実現する現場DX

“防犯カメラ”を超えて、売上と効率の向上へ　LINE WORKS Visionが拓く、AI×クラウドカメラの可能性
sponsored

これが世界第2位の実力だ！　画質も音も高水準なプレミアムテレビ「TCL C8L／C7L」の実力にため息
sponsored
ZEFT G62BHの魅力をインタビュー

Ryzenよりもコスパが優秀!?Core Ultra 7 270K Plus＆RTX 5070のミニタワーゲーミングPC、木材をあしらったデザインも秀逸
sponsored

「ゲームが上手くなった感じ！」「暗いところが見やすい！」GIGABYTE最新モニター体験会で聞いた、参加者のリアルな声
sponsored
話題になった「World Monitor」を軸に「NICTERWEB」や「Flightradar24」も活用

9台のディスプレー＋3台のノートPCで合計12画面！世界を監視・追跡できる大人の秘密基地ごっこをご覧あれ
sponsored

ファミマの「うなぎ」を選ぶ理由　鹿児島県産×魚沼コシヒカリで2000円台から
sponsored

Mac mini用「TREBLEET Thunderbolt 5ドック」にSamsung「9100 PRO SSD」を挿して使ったら快適すぎた
sponsored
MSI「Prestige 14 Flip AI+ D3M」レビュー

Core Ultra 9で23時間駆動、2in1スタイルを13.9mmに凝縮！タッチペンが底面に収納できる良コスパのビジネスノートは投資に見合う有力候補だ
sponsored
生成AIを「自社の専門家」に育てる！社内データ連携がもたらす精度向上が圧倒的だった

難易度の高いテクサポとコンテンツローカライズをどう効率化？　 AI活用のリアルな実践例
sponsored
音質、ANC、デザインとファーウェイならではの独自のテクノロジーが満載

ファーウェイ製イヤホンで最高の音質！「HUAWEI FreeBuds Pro 5」レビュー　さらに強化のノイキャンに空間オーディオにも注目
sponsored
TCL JAPAN ELECTRONICS「27C2A Pro」

「画質」か「速度」か、その妥協を終わらせる。TCL 27C2A Proが提示する、2026年ゲーミングモニターの最終回答
sponsored
JN-IPS29G200WF-HSをレビュー

29型のワイドフルHD（2560×1080ドット）ゲーミングディスプレー、200Hz・1ms・昇降式多機能スタンドで3万2980円は断然買いでしょう
sponsored
ZEFT R61SBCの魅力をインタビュー

COSMOS ALPHAを採用する約190万円のウルトラハイエンドゲーミングPCが爆誕、紆余曲折あったCOSMOSシリーズの技術的継承と仕切り直し
sponsored
お得な情報満載のLINE友達登録やB2Bメンバーカードポイントも注目!!

静岡でパソコンに困ったら迷わずGO！自作PCパーツからローカル生成AI、駆け込み修理まで網羅するパソコン工房静岡店の魅力
sponsored
今年のJavaイベントは“Agentic Dev”をテーマに実践的な学びの機会を

Java開発者が“AI時代に生き残る”ための答えがそこに　「Microsoft Java Day」の開催は間もなく
sponsored
JN-MD-V116Qをレビュー

2万1980円のキックスタンド付き11.6型WQHDモバイルディスプレー、すごく安いけど買っても大丈夫？
sponsored
「1日1回充電」そんな常識はこのスマートウォッチには当てはまりません！

常識を覆す実力派スマートウォッチ！「HUAWEI WATCH FIT 5 Pro」のココがスゴい
sponsored
LEVEL-M8AM-LCR98D-XKMXB-Limited Edition [RGB Build]をレビュー

待望のGeForce RTX 5090 Founders Edition搭載ゲーミングPCが登場！CPUはRyzen 7 9800X3Dでミニタワーでも性能は怪物級、生成AIでも強い！
sponsored
経営者や取引先のなりすましメールを見抜く「FortiMail」と、フォーティネットの包括的な保護

社長の【至急】メールはニセモノ！ビジネスメール詐欺で15億円の被害発生… どうやったら防げた？
sponsored
Lepton Motion Pro II B860iをレビュー

Core Ultra 7 270K Plus＆RTX 5060 Ti 16GBで映像編集にローカルLLM、ゲームも快適なPC！まるっこいずんぐりボディーもカワイイ
sponsored
今井翔太氏、宮田裕章氏と探るAI進化の最前線と、AI Companion 3.0の実力　「Zoom Experience Day」レポート

“DXのパラドックス”を解く鍵は「会話の統合」　Zoomが目指す「AIがタスクを完結させる」ビジネスの未来
sponsored
“商談の風向きが変わった”を素早く捉えるAI活用術、「Zoom Experience Day」対談レポート

「仕事の6割はAIが代替」営業マネージャーがAI時代を生き残るには“VPレベルの思考”が必要
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！