このページの本文へ

新清士の「メタバース・プレゼンス」 第151回

画像・動画生成AIの常識が変わる、Claude Codeに全部やらせる方法論

2026年04月06日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

うまく動かすためのコツ

 ここからが、うまく動かすためのコツです。まずComfyUIのUI上で、生成させたいWorkflowで通常通り一度生成します。例として、アリババが1月にリリースした実写系に強く、軽量という評価を取っている「Z-Image Turbo」のワークフローを公式テンプレートからダウンロードして、各種の環境を整えて一度生成します。そして、Claude Codeに以下のように指示します。

 今、Z-Image Turboの画像を生成したので直前に使ったWorkflowを把握してくれる?

 そうすると、Claude Codeは直前に生成したログデータから情報を把握し、そのWorkflowを生成可能になります。「シード値を変えて、同じプロンプトで生成して」と指示すると、ComfyUIに直接指示して、画像を作り出します。生成した結果は、ComfyUIのOutputフォルダに生成されますが、筆者はVSCodeで見たいため、終了後にコピーして、直接見ることができるようにしました。さらに、テンプレートとしてWorkflowをJSONとして保存するように指示しました。

 さて、ここからが本番です。Z-Image Turboは自然文による入力が可能です。プロンプトを解釈するClipは「Qwen3-4B」という小さなモデルが使われています。日本語でも入力は可能なのですが、アウトプットの品質を求めるなら、学習時に多く使われている英語や中国語で記述したほうがよいとされています。

Claude CodeをVSCodeで動かしている様子。左のファイル一覧から見えるようにして、左側に表示されるようにしている

 まず、Z-Image Turboのプロンプトガイドが存在しないかWeb検索をして探させます。その結果、GitHubにコミュニティにより開発されたilluminatianonさんがまとめているプロンプトガイドが英語で存在していたため、そこから「Z-Image Turbo ベストプラクティスガイド」をMDファイルとしてまとめさせました。それによると、Z-Image Turboは、ポジティブプロンプトに以下の全部のプロンプトを盛ると、効果が出やすいということがわかりました。

[構図・被写体] + [年齢・外見] + [服装] + [背景] + [照明] + [雰囲気] + [スタイル] + [技術指定] + [制約(no watermark等)]

 ただ、この複雑な設定を気にする必要はありません。「ベストプラクティスを参考に、おしゃれな喫茶店でコーヒーを飲んでいる日本の若い女性の画像のプロンプトを検討してくれる?ライト演出をうまく描いてね」と指示を出しました。その結果、長いプロンプト案が英語で出てきました。そして、「それを横長で生成して」と指示すると、Claude CodeはComfyUIを使って画像を生成しました。その結果は、かなり意図通りになっています。

Claude Codeがまとめたプロンプト。かなり長い。内容を把握したければ、日本語に翻訳してと指示すればよい

プロンプトで生成された画像

 さらに「同じ設定で、夜にして、部屋の明かりや静かな雰囲気をうまく描いて」と指示すると、次のような画像になります。AIは読み込み時に内容を解釈できるので、以下のようなコメントを付けてきました。「窓の外の雨の夜景、ガラスに映るネオンの反射、ペンダントランプの琥珀色、テーブルのキャンドル、暗がりに浮かぶ顔——全部入ってる。最後の客感がしっかり出てるね」

昼の設定を夜に変えて再生成してみた結果。しっかり出ている

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ