このページの本文へ

新清士の「メタバース・プレゼンス」 第132回

画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」

2025年11月17日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

軽量版ならサイズは6GBほど

 ChronoEditは画像生成をするために、まず低FPSの動画を内部で生成し、時間的一貫性を保ったまま、終端フレームを静止画として採用するという仕組みになっています。先のフレームの計算をすればするほど、プロンプトに合わせた結果になりやすく、より期待される画像が出る可能性が高まります。

 ChronoEditは、フルモデル「ChronoEdit-14B」と軽量モデル「ChronoEdit-2B」の2種類が用意されています。14Bは、動画モデル「Wan2.1-I2V-14B-720P」をファインチューニングしたモデルです。そのため、Wan2.1が動作する「ComfyUI」用ワークフローであれば、ローカルPC上でも、動かすことができます。

 14Bを動かせるワークフローは様々なものが公開されているのですが、筆者は、ComfyUI Workflow BlogのEshaさんが公開されているモデルを利用しています。拡張機能などを入れる必要がありますが、シンプルでわかりやすいです。Eshaさんのサイトでは、必要となるモデルの一覧もまとめられています。

 ハイエンドのサーバーで開発された14Bはフルスペックでは90GBもあるため、利用時にはローカルPCの環境に合わせて、ユーザーによって量子化(圧縮化)されたバージョンを使う必要があります。筆者が利用しているFP8は16GBほどありますが、一番小さい「ChronoEdit-14B-Q2_K.gguf」であれば6GBほどです。各種の設定をして生成すると、ChronoEditを手軽に動かすことができます。

 作例として、ふたたび明日来子さんで試してみました。プロンプトは「若い女性が上半身を前かがみにしながら、コーヒーカップを机に置く」としました。圧縮版の影響か、若干、セーターの模様が単純化されているようにも見えますが、うまく成功しています。ChronoEditは動画生成をしてから、画像を作り出すという特徴を持っているため、このワークフローは動画も同時に生成します。

明日来子さんを使った画像。下がベースとした画像で、上が変化後の画像

△ChronoEditによって生成された動画。1736x1184の48フレーム(16fpsの3秒分)

Eshaさんのワークフロー(見やすくするために、ノード位置を若干調整している)

カテゴリートップへ

この連載の記事
ピックアップ