ある人工知能(AI)のアルゴリズムがついに、ほとんどの人が当たり前にできる作業を制覇した。それは朝、服を着ることだ。
服を着ることは、機械にとって驚くほど困難である。非常に柔軟な素材と格闘しなければならないからだ。たとえば、セーターを着るときの面倒な動きを考えてみよう。生地を自分に向けて引っ張り、セーターを破らないようにしながら胴体をちょうどよく入れ、両腕と頭の上にかぶせなくてはいならない。
ジョージア工科大学の研究チームはこのほど、形状や開始位置が変わった場合にも服を着ることができる、人型のキャラクターを開発した。このプログラムでは、機械学習の手法である強化学習 (RL)アルゴリズムが使われている。強化学習は、人間が動物を訓練する方法に着目し、報酬とペナルティを利用してAIエージェントに望ましい目的を達成させる手法である。今回の場合、アルゴリズムは人形キャラクターが正しい穴に頭と手足を入れたときに報酬を、生地が破れるような行動をとったときにペナルティを与えた。
研究チームは、服を着る動きを、単一目標に向けた1つの長いタスクとしてプログラムするのではなく、いくつかのサブタスクに細分化した。たとえば、シャツの上面だけをつかんで開口部を開く、手をシャツの中に入れる、手を袖に通す、といった具合だ。1つ1つのサブタスクは何時間ものシミュレーションと最適化が必要だったが、最終的な能力はさまざまな服の種類に対してよりしっかり対応できるものになった。
こうした複雑な運動技能をシミュレートする能力は、コンピューター・アニメーションやエンターテインメント分野において、より現実的な身体的経験を生み出すのに適している。機械に対して変動する環境条件に適応する能力を与えられるため、ロボット工学の一層の進化に応用できる可能性もある。