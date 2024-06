Luma AIは6月12日(現地時間)、テキストや画像から5秒間の高品質な動画を作成できる画像生成AIモデル「Dream Machine」を公開。無料ユーザーでも毎月30本の動画を作成できる。

Dream Machineはテキストプロンプトおよび画像から高品質でリアルかつ幻想的な動画を作成するAIモデル。

ユーザー登録するだけで、誰でも120フレーム(24fps x 5秒)の動画を毎月30本無料で作成できる。

スケーラブルで効率的なマルチモーダルTransformerアーキテクチャ上に構築されたDream Machineは動画によってトレーニングされており、物理的に正確で一貫性のあるアクション満載のシーンを生成することができるという。なお、トレーニング動画についての説明は今のところない。

モデルのトレーニングにはAmazon Web Services(AWS)および、現在最も高性能なAI用ビデオボード「NVIDIA H100」を使用した機械学習トレーニングインフラストラクチャ「SageMaker HyperPod」が使用されている。

使い方は極めてシンプル。Googleアカウントでログインしたら、プロンプト(日本語もOK)を入力するだけ。

画像をアップロードし、その画像をアニメーションさせる「i2v(image to video)」も可能だ。

生成にかかる時間は120秒だが、ピーク時にはその前にしばらく順番を待つ必要がある。

XにはDream Machineの作例が多数投稿されている。

下の動画では5秒の中でカットが切り替わっている。

Next level text to video! pic.twitter.com/oPyV7Sp2R8

ブラー(ぼかし)表現や照明の当たり方もリアルだ。

Realistic camera movements that blur the boundaries of reality 🎥: @Next_On_NOwpic.twitter.com/I76lI1ENrh