Робота научили манипулировать мягкими и деформируемыми объектами — Роботех

Робота научили манипулировать мягкими и деформируемыми объектами

Роботы сегодня уже обладают огромным набором навыков и умений, которые позволяют им работать наравне с людьми, но некоторые задачи по-прежнему для них остаются невыполнимыми. Машины до сих пор не умеют работать с мягкими и легко деформируемыми предметами. Эту ситуацию решили исправить специалисты МИТ.

Они создали новую среду моделирования под названием PlasticineLab. С ее помощью они намерены упростить процесс обучения роботов новым навыкам. Встраивая в симулятор знания о физическом мире, исследователи надеются упростить обучение роботов манипулированию объектами и материалами реального мира, которые часто сгибаются и деформируются, не возвращаясь к своей первоначальной форме. 

В PlasticineLab агент-робот учится выполнять ряд заданных задач, манипулируя различными мягкими объектами в процессе моделирования. В RollingPin цель состоит в том, чтобы расплющить кусок теста, надавливая на него, намотать веревку на столб и т. д.

Новый алгоритм позволил гораздо быстрее обучить робота новым навыкам, чем любые другие способы.

«Программирование базовых знаний физики в симуляторе делает процесс обучения более эффективным. Это дает роботу более интуитивное ощущение реального мира, который полон живых существ и деформируемых объектов», — говорит ведущий автор исследования, Чжиао Хуанг, бывший стажер MIT-IBM Watson AI Lab, а теперь аспирант Калифорнийского университета в Сан-Диего.

«Роботу могут потребоваться тысячи итераций, чтобы справиться с задачей с помощью метода проб и ошибок обучения с подкреплением, который обычно используется для обучения роботов в моделировании. Мы показываем, что это можно сделать намного быстрее, если учесть некоторые знания физики, которые позволяют роботу использовать для обучения новые алгоритмы», — говорит старший автор работы Чуанг Ган , исследователь из IBM.

Уравнения базовой физики встроены в PlasticineLab с помощью графического языка программирования Taichi . И TaiChi, и более ранний симулятор ChainQueen , на котором построена PlasticineLab, были разработаны соавтором исследования Юаньмином Ху. Благодаря использованию алгоритмов планирования на основе градиента агент в PlasticineLab может постоянно сравнивать свою цель с движениями, которые он совершил к этой точке, что приводит к более быстрой корректировке курса.

Напомним, ранее ученые научили роботов «думать вслух», чинить себя самостоятельно и даже потеть.

Add a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *