独自の深層学習手法は、AIの進化としても注目
グランツーリスモ・ソフィーの開発成果については、科学誌Natureにも論文が掲載されAIの大きな進化のひとつとして注目されている。
開発においては、新たな深層強化学習アプローチと新たなプラットフォームを構築した点が特徴だ。
深層強化学習の手法を用いて、車のスピードや加速、コースの境界線、対戦相手との位置関係、進行状況などの環境を把握。これらの情報をもとにアクセル、ステアリング、ブレーキの状況を学習し、相手を追い越したときなどはプラスのシグナルとして与え、正しくないラインを走っているときなどはマイナスのシグナルを与えることを繰り返したという。
また、大規模な訓練を実施するために、グランツーリスモSPORTのインスタンスを多数実行できる分散型強化学習プラットフォームを開発。同時並行でグランツーリスモSPORTをプレイして、学習を繰り返したという。
ソニー・インタラクティブ エンタテインメント フィーチャーテクノロジーグループのウーリー・ガリッツィシニアバイスプレジデントは、「通常のAIシミュレーションではモデルを作成し、実行するが、この作業に、多くの手間と時間がかかる。だが、グランツーリスモ・ソフィーでは最先端の学習アルゴリズムやトレーニングシナリオなどを含む、ソニーAIが開発した新たな深層強化学習技術により、何万通りものシミュレーションを同時に実行できるようになった。これを実行するために、SIEは全世界に広がる大規模クラウドゲームインフラを活用した最先端の環境を提供し、シミュレーションを簡単に実行できるようにした。これにより、世界トップレベルのゲームAIエージェントを育て上げ、世界屈指のプレイヤーと競い合わせることができた」とする。
ソニーAIのシュプランガーCOOによると、何も学習していないAIエージェントが、コースを周回できるようになるまでに1日かかり、グランツーリスモSPORTのドライバーのトップ5%の水準に入るまで2日間かかるという。さらに、世界トップクラスのドライバーになるには10~12日間の学習が必要になる。「その間、グランツーリスモ・ソフィーは、30万kmを走行することになる」という。
コースや車体の違いごとに学習する必要があり、その組み合わせを考えると、すべてのコース、車両で世界トップクラスになるには、それなりの時間がかかりそうだ。
![](/img/blank.gif)
この連載の記事
-
第606回
ビジネス
テプラは販売減、でもチャンスはピンチの中にこそある、キングジム新社長 -
第605回
ビジネス
10周年を迎えたVAIO、この数年に直面した「負のスパイラル」とは? -
第604回
ビジネス
秋葉原の専門店からBTO業界の雄に、サードウェーブこの先の伸びしろは? -
第603回
ビジネス
日本マイクロソフトが掲げた3大目標、そして隠されたもう一つの目標とは? -
第602回
ビジネス
ボッシュに全株式売却後の日立「白くまくん」 -
第601回
ビジネス
シャープらしい経営とは何か、そしてそれは成果につながるものなのか -
第600回
ビジネス
個人主義/利益偏重の時代だから問う「正直者の人生」、日立創業者・小平浪平氏のことば -
第599回
ビジネス
リコーと東芝テックによる合弁会社“エトリア”始動、複合機市場の将来は? -
第598回
ビジネス
GPT-4超え性能を実現した国内スタートアップELYZA、投資額の多寡ではなくチャレンジする姿勢こそ大事 -
第597回
ビジネス
危機感のなさを嘆くパナソニック楠見グループCEO、典型的な大企業病なのか? -
第596回
ビジネス
孫正義が“超AI”に言及、NVIDIAやOpen AIは逃した魚、しかし「準備運動は整った」 - この連載の一覧へ