「ゲームエンジンをニューラルネットワークで置き換える」が目標のGameGAN、自動運転などへの展開も

NVIDIAのAI、「パックマン」のプレイ画像からゲームを“再生成”

2020年05月26日 08時00分更新

文● 五味明子　編集● 大塚／TECH.ASCII.jp

　NVIDIAは2020年5月22日（米国時間）、同社の研究機関であるNVIDIA Researchが開発したAIモデル「NVIDIA GameGAN（以下、GameGAN）」を活用し、誕生から40周年を迎えたゲーム「パックマン」をゲームエンジンなしで“再生成”したことを発表した。

AIに大量の「パックマン」プレイ画像を与えただけで、ゲームの構成要素やルールまでを学習した“再生成”版パックマンが生まれた

　オンライン会見を行ったNVIDIAトロントAI研究所のサーニャ・フィドラー（Sanja Fidler）氏は、今回の取り組みを次のように説明し、今後は自動運転などリアルワールドへの展開も視野に入れていることを明らかにしている。

　「今回の成果は、GameGANがパックマンのエピソード（プレイ）を5万回見てその振る舞いを学習し、フルGPUでトレーシング（模倣）したもの。（パックマンの）オリジナルのプログラミングコードはいっさい見ることなく、かなり高いレベルでゲームを再現できている。将来的にはゲームの世界だけでなく、自動運転などの分野でエージェントが動画を見るだけで、その振る舞いを模倣できるAIを生み出せる可能性がある」

GameGANではスクリーンプレイとエージェントやユーザのアクションを観察して学習を重ねたニューラルネットワークが、従来のゲームエンジンに取って代わることをゴールに掲げている

大量のプレイ画像を与えるだけで、AIがゲームの構成要素やルールを自ら学習

　NVIDIAのGameGANは、「敵対的生成ネットワーク（GAN: Generative Adversarial Network）」と呼ばれるディープラーニングを活用した生成モデルをベースにしている。具体的には、「ジェネレータ」と「ディスクリミネータ」と呼ばれる2つのニューラルネットワークを“敵対”させながら互いにトレーニングを繰り返させることで、最終的にはジェネレータが高い精度のデータを生成できるようになるという、教師なし学習の手法だ。

　GANにおけるジェネレータとディスクリミネータの関係は、よく“偽札製造者と警察”の関係に例えられる。偽札製造者（ジェネレータ）は「いかに警察を騙すレベルの偽札を作れるか」、警察（ディスクリミネータ）は「いかに偽札を見破る能力を高めるか」を目的としてトレーニングを繰り返す。こうしてお互いがレベルを高め合うことで、最終的には偽札業者が本物とほぼ違わない高い精度の偽札を作れるようになる――こうした概念に基づいている。

　今回の実証実験では、パックマンの配給元であるバンダイナムコ研究所から提供された5万エピソード（数百万フレーム）に及ぶパックマンのプレイ画像と、ゲームをプレイするエージェントのキーストロークデータだけを与えて、ニューラルネットワークのトレーニングを4日間ほど行った。

　その結果、ゲームの要素――迷路やトンネル、ドット、パワーエサといった静的な要素から、パックマンやモンスターなど動的な要素に至るまで――を、高いレベルで再現している。さらにゲームの外観だけでなく、オリジナルのパックマンと同じルール（迷路の壁は通り抜けられない、動き回りながらドットを食べる、パワーエサを食べるとモンスターはブルーになる、モンスターに捕まると画面が点滅して終了するなど）についても学習できた。

　さらに、このパックマンはプレイすることも可能だ。GameGANが用意した画面（フレーム）でエージェントがパックマンを動かすと、その動き（キーストローク）に対応して、GameGANがリアルタイムに次の画面をレイアウト／レンダリングして生成する。この処理をひたすら繰り返すことで、ゲームエンジンを使うことなくパックマンが“再生成”できている。

GameGANにはダイナミクスエンジンが生成した画像を保持する外部のメモリモジュールを利用し、レンダリングエンジンに画像を渡すことでより高い精度の描画を可能にしている。画像は上から順に、ActionーLTSM、ワールドモデル、メモリモジュールなしのGameGAN、メモリモジュールを実装したGameGANの描画結果を比較したもの

　なお今回のGameGANのトレーニングには「NVIDIA DGXシステム」が、またゲームの再現には「NVIDIA Ominiverse（シングルQuadro RTX 8000搭載）」が使われている。

「ゲームエンジンの置き換え」から自動運転車や倉庫用ロボットへ

　NVIDIAでは、GameGANのゴールを「ゲームエンジンをニューラルネットワークで置き換える」と定めており、オリジナルのゲームとして十分通用するレベルのコンテンツの開発を目指しているが、単にオリジナルを模倣するだけでなく、静的要素（背景）と動的要素（キャラクタ）を別々に生成可能なGameGANの特徴を用いて、パックマンを絵文字や別のキャラクタに変えたり、背景を迷路から生け垣に変更するなど、新しいキャラクタやテーマの実験の場としても活用することができるとしている。

　フィドラー氏は「GameGANは“ゲームエンジンキラー”になりうるが、ゲーム開発者とは敵対するのではなく、十分に共存できる」と語っており、AIが既存のゲームに新しい可能性をもたらすことを示唆している。

パックマン誕生40周年を記念して、パックマンとさまざまな企業とのコラボレーションが発表されている。今回のNVIDIAとの取り組みもその一環だ

　NVIDIAでは、パックマンの配給元であるバンダイナムコと「約8カ月ほど前からパックマンの40周年にあわせて何か特別なことをしたいと話し合ってきた」（NVIDIA シミュレーション部門バイスプレジデントレブ・レバディアン氏）という。

　バンダイナムコ研究所の堤康一郎氏は、今回のGameGANによるパックマンの再現について「結果を見て私たちはとても驚きました。アイコニックなパックマンの楽しさを、ゲームエンジンもなしにAIが再現できるとは思ってもいませんでしたから。この研究は、ゲーム開発者が新しいレベルのレイアウト、キャラクター、さらにゲーム自体をも開発するという、クリエイティブなプロセスを加速できるようになる、魅力的な可能性を示しています」と高く評価している。

　GANおよびGameGANの最大の特徴は、比較的低いコストでディープラーニングのアルゴリズムを学習させることができる点だ。たとえば一般的な教師あり学習（入力画像と出力画像のペアで学習を行う）の場合、人間による画像のラベル付け作業が必要となり、精度を高めようとより多くの画像を使用すればするほど、その作業負荷とコストは大きくなる。しかしGAN/GameGANの場合、ジェネレータがレンダリングした画像の正誤判定を行うのはディスクリミネータであり、人間による作業負荷とコストは大幅に軽減される。

　NVIDIAは今回のGameGANによるコードレスでのパックマン再生成の結果をもとに、将来的には自動運転車や倉庫用ロボットなど、従来、シミュレータの作成に大量の開発リソースを必要としてきたた分野にニューラルネットワークを適用させていく意向を示している。フィドラー氏は「チャレンジングではあるが非常にやりがいがある。GameGANはその第一歩」と語っている。