このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第50回

“世界生成AI”到来か 画像生成AIのゲームエンジン化が進む

2024年01月22日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成)

 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画像を生成するというものの可能性を超える存在を狙うことを予告したと。この目標はすなわち、画像生成AIをゲームエンジン化することを意味しています。

 ホロデッキというのは、SF作品の「スタートレック」の宇宙船に装備されているAR的な特別な装置のある部屋のこと。特定の世界を生み出すようコンピューターに指示すると、現実と変わらないほどのリアルさで、その世界が瞬時にできあがるというものです。様々な物語を展開するために有効なSF的な舞台装置ですが、メタバースの分野ではこの実現がゴールの1つとされてきた面があります。デイヴィッド・ホルツCEOは、画像生成AI技術を発展させるアプローチによってこれを実現させようとしているわけです。

MidjourneyでSF的なオープンワールドも簡単に呼び出せるかも(筆者作成)

 ホルツ氏は「Midjourneyはすごく速く描けるアーティストではなく、むしろ、とても遅いゲームエンジンのようなもの。将来は1分間に1枚の(生成)画像ではなく、60fpsのフルボリューメトリック3Dになるでしょう」とも述べたそうです。

 Nick St. Pierreさんによれば、ホルツ氏は過去のオフィスアワーで、3Dガウシアン・スプラフティングやNeRFを独自技術化し、3Dシーンを生成することを目指していると明らかにしているそうです。これはどちらも2D画像や動画から3D空間を作り出す「ボリューメトリック」と呼ばれる技術です。

 つまり、Midjouneryに作ってほしい世界をプロンプトで指示すると、画像ではなく、60fpsで動作し、内部を自由に動き回れる3Dシーン全体が生成される未来が来ると、ホルツ氏は考えているわけです。もし1秒間に60枚も生成できるようになれば、それはゲーム機などで表示されている速度と変わらなくなります。

 現在はまだ生成する画像に連続性や一貫性をもたせることは簡単ではありませんが、それを実現するための研究も次々に登場してきています。もし特定の空間をテーマに画像を生成し続けられるとすれば、それらを処理することで3D化を実現することも原理的には可能です。そこに移動やイベントの概念が入ってくれば、もうUnreal EngineやUnityなどのゲームエンジンと呼ばれているものと変わらなくなってきます

 画像生成AIがゲームエンジン化していくというアイデアは、予想としては昨年からすでにありました。しかし、実際に有力な画像生成AIサービスを運用する企業のトップがここまで踏み込んだ発言をしたというのが新しい点です。しかも年末までには実現するということですから、どうやろうとしているのかに興味がわきますね。

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ