OpenAI научила робота собирать кубик Рубика — Роботех

OpenAI научила робота собирать кубик Рубика

Компания OpenAI обучила пару нейронных сетей собирать кубик Рубика рукой робота. Нейронные сети полностью обучены моделированию, используя тот же обучающий код подкрепления, что и OpenAI Five, в сочетании с новой техникой, называемой автоматической выборкой доменов (ADR). 

Система может обрабатывать ситуации, которые она никогда не видела во время тренировок. Это показывает, что обучение с подкреплением не только инструмент для виртуальных задач, но и может решать проблемы физического мира, требующие беспрецедентной ловкости.

За последние 60 лет робототехники сложные задачи, которые люди решают с помощью фиксированной пары рук, требуют разработки собственного робота для каждой задачи . В качестве альтернативы люди потратили много десятилетий, пытаясь использовать универсальное роботизированное оборудование , но с ограниченным успехом из-за их высокой степени свободы. В частности, аппаратное обеспечение, которое здесь используется, не является новым — рука робота существует уже 15 лет, но программный подход абсолютно обновлен.

Тренировки по сборке роботизрованной рукой кубика Рубика проводятся с мая 2017 года. Ученые поставили себе такую цель, потому что считают, что успешное обучение руки робота для выполнения сложных задач манипулирования закладывает основу для универсальных роботов. Кубик Рубика в симуляции был собран уже в июле 2017 года. Но по состоянию на июль 2018 года ученые могли манипулировать только блоком робота. Теперь же они достигли своей первоначальной цели.

Решение кубика Рубика одной рукой — сложная задача даже для людей, и детям требуется несколько лет, чтобы приобрести ловкость, необходимую для его освоения. Наш робот все еще не усовершенствовал свою технику.

Собрать кубик Рубика рукой робота все еще непросто. Новый метод позволяет собрать кубик Рубика в 20% случаев, применяя максимально сложную технику, которая требует 26 вращений граней. Для более простых схваток, которые требуют 15 вращений, вероятность успеха составляет 60%. Когда кубик Рубика уронили или истекло время ожидания, ученые считают, что попытка не удалась. Однако разработанная OpenAI сеть способна собрать кубик Рубика из любого начального условия. Таким образом, если куб упал, можно положить его обратно в руку и продолжить решение.

Add a Comment

Ваш e-mail не будет опубликован. Обязательные поля помечены *