Компания OpenAI обучила пару нейронных сетей собирать кубик Рубика рукой робота. Нейронные сети полностью обучены моделированию, используя тот же обучающий код подкрепления, что и OpenAI Five, в сочетании с новой техникой, называемой автоматической выборкой доменов (ADR).