「グランツーリスモ」・山内一典氏が求める 「車とデータ」のイノベーション
山内一典(「グランツーリスモ」シリーズ クリエイター)
「手段のために目的を選ばず」人と競えるAIも開発
――「グランツーリスモ」はリアルドライビングシミュレーションであり、レースゲームだ。しかし山内氏は「自分たちをビデオゲーム・デベロッパーだと認識したことはない」という。
山内:自分たちがやりたいことについて、テクノロジーへの好奇心がドライブしているところがあります。だから僕は「手段のために目的を選ばず」なんてよく言うのですが、社内でも「何を研究してみたいか」ということをゴールに据えて始めることはよくあります。
それに、「グランツーリスモ」は「あの車が欲しい」「世界中の車に乗りたい」という気持ちがあって、「ならレースゲームを作ろう」という発想で生まれたものですし(笑)。
――ポリフォニー・デジタルでは、「グランツーリスモ」開発に関わる「あらゆる技術」が研究されている。それと並行し、ゲーム自体の開発も行われている。近年研究されたのは、「グランツーリスモ」を「実際に走る」ことで作られたドライバーAIだ。
一般論としてゲームの中で表現される「敵」は、俗に「ルールベースAI」と呼ばれる。プレイヤーの動きやゲームの進展に合わせ、事前に開発側がルールを決めており、それに従って動くわけだ。だが、そのやり方では人間のような動きや判断にはならない。
そんな中でてきたのが、ドライバーAI「Gran Turismo Sophy(グランツーリスモ・ソフィー、GT Sophy)」の開発プロジェクトだ。研究はソニーのAI基礎研究機関「ソニーAI」と、ポリフォニー・デジタルが共同で行なった。
山内:GT Sophyを開発しようと思ったのは、まさにAIへの好奇心からです。
GT Sophyはネットワーク上に1000台のPlayStation®4を用意し、実際にAIをドライバーとしてゲーム内で走らせて、その結果から機械学習を行い、作り出しました。
「グランツーリスモ」のAIは、人間と同等か、それ以上に速く走ることが求められます。しかし、AIが人に勝つことを目標に開発したのではない。それではつまらない。レース中はシチュエーションが刻一刻と変化します。そんな中で常に妥当な振る舞いを見せること、人間から見てもそれが自然に見えること、これがすごく重要。そうしたことは、これまでのAIでは難しかったのです。
GT Sophyは30万キロを走り込んで、eスポーツで世界トップクラスのドライバーと互角に競い合えるほどのAIになりました。その過程からは、「人間ってこういうことをしているのだな」という多くの気づきが得られました。改めて、速く走るときには人がどのように運転しているのか、ということが見えてきたのです。
ですが、今のAIはまだ、人間でいう大脳新皮質がない状態に近い、チャットボットのようなAIエージェントのレベルです。ようやく「フェアに人と走れる」AIを作れましたが、より人間らしく走らせるためには、まだまだ開発の余地はあります。
リアルなコースデータ作りの裏にあるイノベーション
――レーシングAI・GT Sophyのようなものを開発できているのは、「グランツーリスモ」の中に作られた世界、すなわち「コース」が精緻なものになっているからでもある。
1997年発売の初代『グランツーリスモ』では、コースはすべて架空のものだった。しかし現在は、鈴鹿サーキット(日本)やデイトナ・インターナショナル・スピードウェイ(米国)、ニュルブルクリンク(ドイツ)などの、世界の名だたるサーキットが収録されている。どれも現地におもむき、さまざまな技術を使って「スキャンしてデータ化」されたものだ。
最新の『グランツーリスモ7』にも、架空のコースは存在する。だがそれらは、現実のコースと遜色ない、新しい存在へと進化して組み込まれている。
山内:最初は架空のコースでしたが、そこから次第に現実のコースに移っていきました。もちろん、現実のコースをキャプチャーして、完全再現する必要があります。
その過程で得られたのは「世の中はこうなっているのか」という知見です。そういった知見が、新たな架空のファンタジーなコースを生み出すためのアイデアやノウハウにつながっているのです。
――現実のコースを作る、といっても簡単な話ではない。「どんな風にコースをデータ化しているのですか?」と聞くと、山内氏は「大変なのですよ」と苦笑した。
山内:あらゆる方法を使っていますね。
俯瞰的な情報が必要な場合には、ドローンやヘリ、飛行機を上空に飛ばしてそこからスキャンします。
LiDARももちろん使います。搭載した車を走らせたり、移動しながらスキャンしたり。さらに細かいところをデータ化するには、固定型のスキャナーも使います。
路面のデータはミリメートル単位の精度が必要になります。道の脇、近・中距離の部分はセンチメートル単位の精度になります。
ゲームの場合、背景は大雑把なデータでも大丈夫な場合が多いです。しかし、カメラ(プレイヤーの視点)の近傍は、精密に作る必要があります。
特に、都市をコースにするのはとにかく大変です。既存のパーマネントコース(実在のサーキットのように常設されたコース)は意外とシンプルなのですよ。
なぜかというと、今のビデオゲームでは、テクスチャー(表面の色や形状、物体の質感などを表現する画像データ)を無制限に使えるわけではないからです。パーマネントコースではデータをある程度繰り返し使うことができるのですが、都市を描く場合には、どうしても独自のテクスチャーが増えてきてしまうのです。
――こうしたデータ作りのジレンマは、冒頭で述べた自動車のデータ化でも同様だ。
精緻なデータ作りにはどうしても手間がかかる。ゲーム開発はコストとの戦いでもあり、いくら「精緻であるほどいい」とわかってはいても、無限に労力とコストをかけられるわけではない。「距離が遠いほどデータが粗いものになる」のは、そうした現実とゲームの特性を掛け合わせた妥協点でもあるのだ。
山内:イノベーションは常に探しています。
より良いものを作っていくにはイノベートしていくしかない。非常にとがった技術であっても取り入れ、いかに機械化していくかを考えていく必要があります。
ですから、AIによるデータ制作もかなり研究を進めています。大量の写真からのフォトグラメトリや、点群からの生成ももちろんですが。
しかし、なかなかうまくいかないですね(苦笑)。
CGデータと現実の物体は作り方が違いますよね。CGはポリゴン(多角形)の面を貼っていくけれど、現実のものはそうじゃない。
例えばガードレールも、人間には「一枚の板をプレスして曲げて、あの形にしている」と直感的にわかりますが、AIはそうではない。
そこで「これは曲げて作ったものですよ」とわからせることができれば、きれいな曲線データでできあがってくると思うのですが、そうでなければ、表面がグズグズに荒れた点群が出てくるだけです。目の前のものがどういうオブジェクトなのかを認識する技術ができてくれば、良くなってくるのでしょう。