タイムラプス風の動画が生成できる「MagicTime」
さらに、インパクトをもって登場してきたのが、同じ研究グループが発表した「MagicTime」という研究です。
植物が成長するような過程を撮影したタイムラプスの動画ばかりを学習させて、動画を生成すると、成長するような過程の動画が作れるようになったというもの。これまでのアニメーションGIFなどではほとんど動いていなかったものが、ちゃんと変化しているように見えるようになっています。
ネット上から収集されたタイムラプスの動画に、タイムラプスとわかるようにテキスト表現する独自の解析方法でキャプションをつけ、約2265個の動画で構成される独自の学習データセット(「ChronoMagic」と呼ばれる)を構築したそうです。
動画は、花の開花、氷の融解、「マインクラフト」での建築物の変化など、強い物理属性を表現していたり、持続性がありながらも、変化が大きなものを選んだようです。その結果、変化が強調されるような動画を生成できるようになりました。
Soraが登場したときに大きな議論を呼んだのが、学習用データを大量に取ることで、自然と物理法則のようなものを学習したのではないかという仮説でした。Open AIはこの件について明確には説明していません。しかし、学習データの量に限界があるとはいえ、MagicTimeの研究が示すのは、どうも仮説が正しい可能性が出てきています。
MagicTimeの論文では、実現した学習済モデルを「タイムラプスから物理的知識を学習」と説明しています。そのうえで、タイムラプス動画を使ったAIの学習が、「物理世界の変容シミュレータを構築する有望な道筋であることが示唆される」と論じています。
MajcTimeのモデルは公開されており、Google Colaboratory上で動く環境が用意されています。桜の花を咲かせてみたり、植物の根を生やしてみたり、マインクラフトの建築物を変化させてみたりということができます。つぼみが破綻したり、物理的には完璧とまでは言えませんが、コンセプトを示すことはできています。
ただ、学習したデータには限界があるため、キャラクターを出したりと、学習されていないデータを出そうとするとあまりうまくいきません。画像生成AI「Stable Diffusion」を手軽に扱う環境として普及が進む「ComfyUI」用の環境も登場してきており、ローカルでも扱えるようになってきています。
OpenAIのSoraに比べるとそこまですさまじいというものではなく、発表から間もない研究ということもあり、限界がある印象は受けます。とはいえ、Sora自体が登場してきたときは「手も足も出せない」くらいの印象でしたが、すでに先行する研究を利用して、愚直に大量にデータトレーニングすれば、Soraと同じようなことができるということ自体が重要な情報です。
もちろん、OpenAIも一部の情報しか公開していないので、Soraのすべてがわかったというわけではありませんが、研究者でもまだできることはあるぞというところです。
この連載の記事
-
第68回
AI
AIが作る3Dモデルの完成度が上がってきた 毎回異なるモンスターが生成されるゲームも実現か -
第67回
AI
アドビの画像生成AI機能がまた進化 白黒3Dモデルがリアルな都市に -
第66回
AI
有名人そっくり、増え続けるAI音声 “声の権利”どう守る -
第65回
AI
画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 -
第64回
AI
自分好みのAIチャット相手を簡単に作れる「Dify」が面白い -
第63回
AI
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 -
第61回
AI
画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも -
第60回
AI
3Dアニメーション技術の革新が止まらない -
第59回
AI
政府、生成AI推進に向けて議論を加速 -
第58回
AI
画像生成AIで同じキャラクターが簡単に作れるようになってきた - この連載の一覧へ