このページの本文へ

少量データのオフライン強化学習でロボット制御、東芝などが開発

2024年05月16日 06時55分更新

文● MIT Technology Review Japan

  • この記事をはてなブックマークに追加
  • 本文印刷

東芝と理化学研究所、東京大学の共同研究チームは、ロボット制御に用いられる機械学習の一つである「オフライン強化学習」において、少量の画像データから複雑なロボット操作を高精度に制御する人工知能(AI)手法を開発した。公開ベンチマーク環境でピッキングや物を置くといった8種類の作業のシミュレーションで評価したところ、従来の手法では36%だった平均成功率を72%に向上できた。

東芝と理化学研究所、東京大学の共同研究チームは、ロボット制御に用いられる機械学習の一つである「オフライン強化学習」において、少量の画像データから複雑なロボット操作を高精度に制御する人工知能(AI)手法を開発した。公開ベンチマーク環境でピッキングや物を置くといった8種類の作業のシミュレーションで評価したところ、従来の手法では36%だった平均成功率を72%に向上できた。 今回の手法では、ロボットアームの操作範囲を撮影した画像からロボットアームの移動先を決定する1段目の制御と、移動先周辺のみを切り取った画像から移動先を補正する2段目の制御により構成される2段階制御を学習する。従来の手法では1段目の制御のみを学習して制御していたが、2段目の制御の学習において、(1)注目領域のみを含む画像が入力されること、(2)データの水増しができること、(3)効率的に学習可能な移動先の補正のみを学習対象としていること、でより高い精度のロボット操作が可能になるという。 同チームによると、あらかじめ作成したデータで学習するオフライン強化学習で精度を上げるには数千以上の学習データが必要になるが、今回の手法を用いると、100程度の少量の学習データで精度を上げることが可能になるという。研究成果は、2024年5月13日から17日にかけて横浜で開催されるロボティクス分野の国際学会「ICRA(IEEE International Conference on Robotics and Automation)」で発表された。

(中條)

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ