Платформа DrEureka (Domain Randomization Eureka) успешно протестирована на роботе Unitree Go1 – четвероногой машине с открытым исходным кодом. Обучение робота проходит в симуляционной среде с использованием рандомизации основных переменных, таких как трение, масса, демпфирование и смещение центра тяжести.
На основе пользовательских запросов ИИ генерирует код для системы вознаграждений и штрафов, которая помогает роботу обучаться в виртуальной среде. После каждой симуляции ИИ анализирует, насколько успешно виртуальный робот выполнил задачу и как можно улучшить её выполнение. Нейросеть способна быстро создавать и выполнять множество сценариев одновременно.
ИИ создаёт задачи с экстремальными значениями параметров, которые могут привести к сбоям или поломкам механизма, и снижение оценки за выполнение учебного сценария. Для корректного написания кода ИИ необходимы дополнительные инструкции по безопасности, иначе нейросеть может начать «жульничать» в стремлении к максимальной производительности, что в реальном мире может вызвать перегрев двигателей или повреждение частей робота.
В одном из искусственных сценариев виртуальный робот обнаружил, что может двигаться быстрее, если отключит одну из ног и будет использовать только три ноги. Исследователи попросили ИИ соблюдать осторожность, учитывая, что обученный робот будет проходить испытания в реальном мире, поэтому нейросеть создала дополнительные функции безопасности для таких аспектов, как плавность движений, ориентация и высота положения тела, а также учёт крутящего момента электродвигателей, который не должен превышать заданных значений.
В результате система DrEureka показала лучшие результаты в обучении робота по сравнению с человеком: машина продемонстрировала 34% прирост в скорости движения и 20% увеличение расстояния, пройденного по пересечённой местности. Этот результат объясняется различиями в подходах: при обучении человек разделяет задачу на этапы и находит решение для каждого из них, в то время как GPT обучает всё сразу, что человеку недоступно.
Система DrEureka позволила перейти от симуляции к работе в реальном мире напрямую. Авторы проекта утверждают, что повышение эффективности платформы возможно при предоставлении ИИ обратной связи из реального мира, для чего нейросети потребуется изучать видеозаписи испытаний вместо анализа ошибок в системных журналах робота.
Среднему человеку требуется около 1,5 лет, чтобы научиться ходить, и лишь немногие способны передвигаться на мяче для йоги. Обученный DrEureka робот успешно справляется и с этой задачей.
Источник: https://3dnews.ru/1104407/ii-okazalsya-effektivnim-sredstvom-obucheniya-robotov
Если вам понравился материал, кликните значок - вы поможете нам узнать, каким статьям и новостям следует отдавать предпочтение. Если вы хотите обсудить материал - не стесняйтесь оставлять свои комментарии : возможно, они будут полезны другим нашим читателям!