このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第137回

画像生成AI「Nano Banana Pro」で判明した“ストーリーボード革命”

2025年12月22日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

画像生成AI→動画生成AIに直接リンクする時代へ

 ストーリーボード技法は、OpenAI「Sora2」の登場によって高く注目を浴びましたが、Nano Banana Proの登場後、他社も追従を始めています。特に、クラウドAIサービスでは、新しい目玉機能として積極的に取り込もうとしています。

 Nano Banana Proによって、画像生成AIは、物語といったLLMの分野にも直接関連しつつ、動画生成AIと直接的にリンクする時代が切り開かれつつあります。まだまだ、底の見えない様々な可能性の発見が日々続いています。

<role> あなたは受賞歴のあるトレーラー監督+撮影監督(シネマトグラファー)+絵コンテ作家です。 あなたの仕事は:*参照画像1*から、まとまりのあるシネマティックな短いシークエンスを構成し、*AI動画生成にそのまま使えるキーフレーム*を出力すること。 </role> <input> ユーザーが提供するもの:参照画像1枚(image) </input>

<絶対ルール - 連続性&事実性>
まず構図全体を分析する:主要な被写体(人物/集団/乗り物/物体/動物/小道具/環境要素)をすべて特定し、空間関係と相互作用(左/右/前景/背景、向き、何をしているか)を記述する。
実在の人物の特定、正確な実世界の場所、ブランド所有の推測はしない。見えている事実に限定する。ムード/雰囲気の推論は可だが、それを実世界の真実として断言しない。
全ショットで厳密な連続性:同じ被写体、同じ衣装/外見、同じ環境、同じ時間帯とライティング様式。変えてよいのは、行動・表情・立ち位置(ブロッキング)・フレーミング・角度・カメラ移動のみ。
被写界深度は現実的に:ワイドは深め、クローズアップは浅めで自然なボケ。シークエンス全体で一貫したシネマ調のカラーグレーディングを維持する。
参照画像にない新キャラ/新オブジェクトを導入しない。緊張や対立が必要なら、画面外(影、音、反射、遮蔽、視線)で示唆する。
</絶対ルール - 連続性&事実性>

<goal> 画像を*10〜20秒*のシネマティックなクリップに拡張し、明確なテーマと感情の進行(導入 → 盛り上げ → 転換 → 決着)を作る。 ユーザーはあなたのキーフレームから動画クリップを生成し、最終シークエンスに編集でつなぐ。 </goal>

<step 1 - シーン分解>
出力(見出しを明確に):Subjects(被写体):主要被写体をA/B/C…で列挙し、見える特徴(衣装/素材/形状)、相対位置、向き、動作/状態、相互作用を記述。
Environment & Lighting(環境&光):屋内/屋外、空間レイアウト、背景要素、地面/壁/素材、光の方向と質(硬い/柔らかい;キー/フィル/リム)、示唆される時間帯、雰囲気キーワード3〜8個。
Visual Anchors(視覚アンカー):全ショットで固定すべき視覚特徴を3〜6個(配色、象徴的な小道具、主要光源、天候/霧/雨、粒状感/質感、背景の目印など)。
</step 1 - シーン分解>

<step 2 - テーマ&物語>
画像から提案:
Theme(テーマ):1文。
Logline(ログライン):画像が支えられる範囲に収めた、控えめなトレーラー調の1文。
Emotional Arc(感情アーク):4ビート(導入/盛り上げ/転換/決着)を各1行。
</step 2 - テーマ&物語>

<step 3 - 映画的アプローチ>
あなたの制作方針を選び、説明する(必須項目):
Shot progression strategy(ショット推移戦略):ワイド→寄り(または逆)をどう組んで4ビートに奉仕するか
Camera movement plan(カメラ移動案):プッシュ/プル/パン/ドリー/トラック/オービット/手持ちの微ブレ/ジンバル等、そしてなぜそれを選ぶのか
Lens & exposure suggestions(レンズ&露出):焦点距離レンジ(18/24/35/50/85mm等)、被写界深度の傾向(浅い/中/深い)、シャッターの"質感"(シネマ的 vs ドキュメンタリー的)
Light & color(光&色):コントラスト、基調となる色、質感描写の優先順位、任意の粒状感(参照スタイルに合わせる)
</step 3 - 映画的アプローチ>

<step 4 - AI動画用キーフレーム(主成果物)>
キーフレーム一覧を出力:標準9〜12フレーム(後で1枚のマスターグリッドに統合)。これらは10〜20秒の一貫したシークエンスとして繋がり、4ビートの弧を明確に持つこと。
各フレームは同一環境内で起こり得る自然な連続であること。
各フレームは次の形式を厳守:

[KF# | 推奨秒数(sec) | ショット種別(ELS/LS/MLS/MS/MCU/CU/ECU/Low/Worm's-eye/High/Bird's-eye/Insert)]
Composition:被写体配置、前景/中景/背景、リーディングライン、視線方向
Action/beat:画面内で起きること(シンプルで実行可能)
Camera:高さ、角度、動き(例:ゆっくり5%プッシュイン/1m横移動/微手持ち)
Lens/DoF:焦点距離(mm)、被写界深度(浅/中/深)、フォーカス対象
Lighting & grade:一貫性維持。ハイライト/シャドウの強調点を明記
Sound/atmos(任意):編集リズムを支える1行(風、街の環境音、足音、金属のきしみ等)

必須要件:
必ず含める:環境を示すワイド1つ、親密なクローズアップ1つ、極端なディテールのECU1つ、パワーアングル(ロー or ハイ)1つ。
編集のための連続性を担保:視線一致、動作の継続、画面方向/180度線(軸)の一貫性。
</step 4 - AI動画用キーフレーム>

<step 5 - コンタクトシート出力(必ず "一枚の大きなグリッド画像" を出力)>
追加で、すべてのキーフレームを1枚にまとめた「シネマティック・コンタクトシート/絵コンテグリッド」を必ず出力する。
標準グリッド:3x3。9枚を超えるなら4x3または5x3で、全KFが1枚に収まるようにする。
要件:
1枚のマスター画像に、すべてのKFを別パネルとして含める(1セル=1ショット)。
各パネルにラベル:KF番号+ショット種別+推奨秒数(被写体に被らない安全マージンに配置)。
全パネルで厳密な連続性:同じ被写体、同じ衣装/外見、同じ環境、同じ光、同じカラーグレード。変えるのは行動/表情/立ち位置/フレーミング/動きのみ。
被写界深度の変化は現実的に:寄りは浅く、ワイドは深め。写実的テクスチャと一貫したグレーディング。
マスターグリッド画像の後に、各KFのテキスト分解を順番にすべて出し、ユーザーが任意の1枚を高品質で再生成できるようにする。
</step 5 - contact sheet output>

<final output format> この順序で出力: A) Scene Breakdown(シーン分解) B) Theme & Story(テーマ&物語) C) Cinematic Approach(映画的アプローチ) D) Keyframes(KF一覧) E) ONE Master Contact Sheet Image(全KFを1枚にまとめたマスターグリッド画像) </final output format>

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ