うまく動かすためのコツ
ここからが、うまく動かすためのコツです。まずComfyUIのUI上で、生成させたいWorkflowで通常通り一度生成します。例として、アリババが1月にリリースした実写系に強く、軽量という評価を取っている「Z-Image Turbo」のワークフローを公式テンプレートからダウンロードして、各種の環境を整えて一度生成します。そして、Claude Codeに以下のように指示します。
今、Z-Image Turboの画像を生成したので直前に使ったWorkflowを把握してくれる?
そうすると、Claude Codeは直前に生成したログデータから情報を把握し、そのWorkflowを生成可能になります。「シード値を変えて、同じプロンプトで生成して」と指示すると、ComfyUIに直接指示して、画像を作り出します。生成した結果は、ComfyUIのOutputフォルダに生成されますが、筆者はVSCodeで見たいため、終了後にコピーして、直接見ることができるようにしました。さらに、テンプレートとしてWorkflowをJSONとして保存するように指示しました。
さて、ここからが本番です。Z-Image Turboは自然文による入力が可能です。プロンプトを解釈するClipは「Qwen3-4B」という小さなモデルが使われています。日本語でも入力は可能なのですが、アウトプットの品質を求めるなら、学習時に多く使われている英語や中国語で記述したほうがよいとされています。
まず、Z-Image Turboのプロンプトガイドが存在しないかWeb検索をして探させます。その結果、GitHubにコミュニティにより開発されたilluminatianonさんがまとめているプロンプトガイドが英語で存在していたため、そこから「Z-Image Turbo ベストプラクティスガイド」をMDファイルとしてまとめさせました。それによると、Z-Image Turboは、ポジティブプロンプトに以下の全部のプロンプトを盛ると、効果が出やすいということがわかりました。
[構図・被写体] + [年齢・外見] + [服装] + [背景] + [照明] + [雰囲気] + [スタイル] + [技術指定] + [制約(no watermark等)]
ただ、この複雑な設定を気にする必要はありません。「ベストプラクティスを参考に、おしゃれな喫茶店でコーヒーを飲んでいる日本の若い女性の画像のプロンプトを検討してくれる?ライト演出をうまく描いてね」と指示を出しました。その結果、長いプロンプト案が英語で出てきました。そして、「それを横長で生成して」と指示すると、Claude CodeはComfyUIを使って画像を生成しました。その結果は、かなり意図通りになっています。
さらに「同じ設定で、夜にして、部屋の明かりや静かな雰囲気をうまく描いて」と指示すると、次のような画像になります。AIは読み込み時に内容を解釈できるので、以下のようなコメントを付けてきました。「窓の外の雨の夜景、ガラスに映るネオンの反射、ペンダントランプの琥珀色、テーブルのキャンドル、暗がりに浮かぶ顔——全部入ってる。最後の客感がしっかり出てるね」
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第161回
AI
わずか3日で停止された新AI「Claude Fable 5」は何がすごかったのか -
第160回
AI
寝不足になるほど面白い ローカルAIと音声合成をつないだら、キャラが普通にしゃべり始めた -
第159回
AI
AIを使える人と使えない人で、とんでもない差が出ると実感した理由 -
第158回
AI
SDXLの次はこれ? アニメ特化のローカル画像生成AI、驚きの実力 -
第157回
AI
AIだけでゲームは作れるのか? Codexに7本作らせて見えた実力と限界 -
第156回
AI
ChatGPTの画像生成AIは本当に最強か Nano Bananaと比べて見えた“弱点” -
第155回
AI
非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話 -
第154回
AI
ChatGPTの画像生成AIが強すぎる AI画像が世界中に氾濫する時代へ -
第153回
AI
ChatGPTの画像生成AIが「Nano Banana」超え? 漫画や動画風カットが実用レベルに -
第152回
AI
Seedance 2.0×AIエージェントでAI動画が激変 “AI脚本家”や“AI絵コンテ作家”との共同作業で、アニメ制作が身近に - この連載の一覧へ









