うまく動かすためのコツ
ここからが、うまく動かすためのコツです。まずComfyUIのUI上で、生成させたいWorkflowで通常通り一度生成します。例として、アリババが1月にリリースした実写系に強く、軽量という評価を取っている「Z-Image Turbo」のワークフローを公式テンプレートからダウンロードして、各種の環境を整えて一度生成します。そして、Claude Codeに以下のように指示します。
今、Z-Image Turboの画像を生成したので直前に使ったWorkflowを把握してくれる?
そうすると、Claude Codeは直前に生成したログデータから情報を把握し、そのWorkflowを生成可能になります。「シード値を変えて、同じプロンプトで生成して」と指示すると、ComfyUIに直接指示して、画像を作り出します。生成した結果は、ComfyUIのOutputフォルダに生成されますが、筆者はVSCodeで見たいため、終了後にコピーして、直接見ることができるようにしました。さらに、テンプレートとしてWorkflowをJSONとして保存するように指示しました。
さて、ここからが本番です。Z-Image Turboは自然文による入力が可能です。プロンプトを解釈するClipは「Qwen3-4B」という小さなモデルが使われています。日本語でも入力は可能なのですが、アウトプットの品質を求めるなら、学習時に多く使われている英語や中国語で記述したほうがよいとされています。
まず、Z-Image Turboのプロンプトガイドが存在しないかWeb検索をして探させます。その結果、GitHubにコミュニティにより開発されたilluminatianonさんがまとめているプロンプトガイドが英語で存在していたため、そこから「Z-Image Turbo ベストプラクティスガイド」をMDファイルとしてまとめさせました。それによると、Z-Image Turboは、ポジティブプロンプトに以下の全部のプロンプトを盛ると、効果が出やすいということがわかりました。
[構図・被写体] + [年齢・外見] + [服装] + [背景] + [照明] + [雰囲気] + [スタイル] + [技術指定] + [制約(no watermark等)]
ただ、この複雑な設定を気にする必要はありません。「ベストプラクティスを参考に、おしゃれな喫茶店でコーヒーを飲んでいる日本の若い女性の画像のプロンプトを検討してくれる?ライト演出をうまく描いてね」と指示を出しました。その結果、長いプロンプト案が英語で出てきました。そして、「それを横長で生成して」と指示すると、Claude CodeはComfyUIを使って画像を生成しました。その結果は、かなり意図通りになっています。
さらに「同じ設定で、夜にして、部屋の明かりや静かな雰囲気をうまく描いて」と指示すると、次のような画像になります。AIは読み込み時に内容を解釈できるので、以下のようなコメントを付けてきました。「窓の外の雨の夜景、ガラスに映るネオンの反射、ペンダントランプの琥珀色、テーブルのキャンドル、暗がりに浮かぶ顔——全部入ってる。最後の客感がしっかり出てるね」
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 -
第147回
AI
ゲーム開発開始から3年、AIは“必須”になった──Steam新作「Exelio」の舞台裏 -
第146回
AI
ローカル音楽生成AIの新定番? ACE-Step 1.5はSuno連携で化ける -
第145回
AI
ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う -
第144回
AI
わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった -
第143回
AI
AIエージェントが書いた“異世界転生”、人間が書いた小説と見分けるのが難しいレベルに -
第142回
AI
数枚の画像とAI動画で“VTuber”ができる!? 「MotionPNG Tuber」という新発想 -
第141回
AI
AIエージェントにお金を払えば、誰でもゲームを作れてしまうという衝撃の事実 開発者の仕事はどうなる? - この連載の一覧へ









