エヌビディアは10月20日(現地時間)、ロボットに複雑な動作を学習させることが可能なAIを開発したと発表した。
同AIは「Eureka」という名称で、OpenAIの大規模言語モデル(LLM)「GPT-4」を活用。タスク固有のプロンプトや事前定義された報酬テンプレートを使うことなく、ロボットが動作を訓練するための強化学習用報酬プログラムを生成できるという。
さらにトレーニング結果から報酬関数の生成を改善するようLLMに指示することで、AIが自己改善を実施。四足歩行や二足歩行ロボットからロボットアームや手を模したロボットまで、さまざまなロボットにあらゆる種類のタスクを学習させることが可能とされている。
同社によると、Eurekaが生成したプログラムは80%以上のタスクにおいて、人間の専門家が作成したプログラムよりも優秀なパフォーマンスを発揮。「ペン回し」「引き出しを開ける」「ボールを投げてキャッチする」「両手でドアを開ける」など、30近いタスクをロボットに教え、実行させることに成功したという。
本件については論文とプロジェクトの AI アルゴリズムが公開されており、開発者は強化学習研究用のアプリ「NVIDIA Isaac Gym」上で実験することも可能だ。