このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」第62回

動画生成AI、映像制作の“民主化”目指して研究進む

2024年05月06日 07時00分更新

文● 新清士　編集●ASCII

動画生成AIの研究「Open Sora」から派生した「MagicTime」の技術で生成した桜の開花の動画の一部（筆者作成）

　2024年1月にOpenAIが発表した動画生成AI「Sora」はインパクトがありましたが、DeepMindが開発したフレームごとの動画をブロック状にデータとして出す方式「時空間パッチ（Space-Time Patch）」という方式を使ったのではないかと推測されていました（「動画生成AIの常識を破壊した OpenAI「Sora」の衝撃」参照）。発表された技術レポートの情報を合わせて、推測する方式をまねれば、同様のことができるのではないかということで、新しい動画生成AIの研究が進んでいます。

OpenAI「Sora」まねた研究が続々

　その代表例が、3月リリースされた「Open Sora」というプロジェクト。中心として進めているのは、中国系のAIスタートアップのHPC-AI Techという企業などの中国系の研究者たちです。Soraのメソッドで推測できる部分から、再現していこうというプロジェクトで、「すべての人への効率的な映像制作の民主化」というコンセプトを掲げています。

Open Soraで生成された動画。2秒と限定的だが一貫した動画が作れている（GitHubより）

　適切なデータセットを揃えられれば、似た動画を生成できる可能性があるため、Soraを既存技術で再現しようとしているのです。16フレームで学習しているため、最長2秒で、解像度も240x426ピクセルと小さなサイズですが、Soraをまねた空間的な特徴を学習することができる手法を使うことで、一貫性を維持した動画の生成に成功していました。最初のバージョンの1.0では3日間のトレーニングで実現できたと述べています。

Open Sora Planで生成された動画。2秒ながら複雑な自然の風景の描写に成功している（同上）

　そして、このモデルを土台とした派生研究が登場しています。

　そのひとつが4月に発表された「Open Sora Plan」という派生モデル。北京大学信の袁粒（リー・ユアン）准教授の研究室が開発したモデルです。やはり最長2秒という限界がありますが、基本の画像サイズが512x512ピクセルとなり、クオリティが上がっています。約4万本のパブリックドメインの動画を元に学習したそうです。そのうち60％が風景映像ということで、海の波が打ち寄せる様子や、海中の風景、たき火が燃える様子など、自然物の動画描写を実現しています。

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年05月16日

AI

ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）
2024年05月13日

AI

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性
2024年04月29日

AI

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ
2024年05月15日

AI

新しい「ChatGPT」はココがすごい　解説「GPT-4o」
2024年05月09日

AI

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」
2024年05月10日

AI

15歳の高校生、「日本語能力最強」のAIモデル開発　AITuber向けに設計
2024年05月10日

AI

画像生成AI「Stable Diffusion」が「Midjourney」のように使える（しかも安い）「Stable Artisan」
2024年04月24日

AI

マイクロソフト最新SLM「Phi-3」　メタ「Llama 3」あっさり抜く
2024年03月13日

AI

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」
2024年04月22日

AI

日本語対応の画像生成AI、東京発のSakana AIが発表　既存モデルより10倍高速

ピックアップ

sponsored
Radiant GZ3500Z790/D5をカスタム

BTOってマジ大事。16万円台のふつ～なPCが20万円のi5＆RTX 4060のゲーミングPCに
sponsored
音を知る企業による自社ブランドの第一弾製品

一生使いたいヘッドホンを見つけた。その名は「The Industrial-ist Wired」だ！
sponsored
見た目スッキリでキレイなPCが誰でも簡単に組める

自作PCの配線ゴチャゴチャは過去の話、「PROJECT ZERO」製品一覧と作例を紹介
sponsored
ファッショナブルなデザインに、カロリー管理や睡眠モニタリングなどの便利機能をプラス！

スマートバンドの着け心地とスマートウォッチの高機能が両方ある！ファーウェイ「HUAWEI WATCH FIT 3」レビュー
sponsored
ゲームも作業もすべてがなめらか表示

ヌルヌル動くというのはこのこと、240Hzゲーミングディスプレー「G274QPX」レビュー
sponsored
「STYLE-14FH128-U7-UH2X」をチェック、16:10ディスプレーを採用

1kg以下の14型ノートPCで「Stable Diffusion」も、Core Ultra 7でやりたいことを加速しよう
sponsored
第14世代インテルCore、RTX 40 SUPERシリーズ、DDR5メモリーを選択可能

純白のコスパ最強ゲーミングPCを目指せ！ソフマップの「STORM」BTOパソコンを実機レビューだ
sponsored
ビジネスバッグに入るサイズ感、持ち運べる重量感

実用性能が1グレード高いのに価格はスタンダードなノートPCをレビュー「Modern 15 H C13M」シリーズ
sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか