Исследователи из ETH Zurich разработали роботизированную систему, которая может решать реальные лабиринты с помощью обучения с подкреплением.
Как подробно описано в их исследование "Sample-Efficient Learning to Solve a Real-World Labyrinth Game Using Data-Augmented Model-Based Reinforcement Learning" - этот робот с искусственным интеллектом справился с игрой-лабиринтом BRIO всего за пять часов обучения, превзойдя все известные предыдущие попытки.
Игра-лабиринт BRIO, которая может быть знакома некоторым, - это тест на мелкую моторику и пространственное мышление, требующий от игроков провести стальной шарик через лабиринт, наклоняя игровое поле.
Несмотря на кажущуюся простоту, игра сложна из-за взаимосвязи между мячом и стенами, неровностей поверхности и нелинейной динамики ручек управления. Эти сложности делают лабиринт идеальным местом для применения и оценки современных методов обучения роботов.
Команда ETH Zurich, возглавляемая Томасом Би и профессором Раффаэлло Д'Андреа, разработала метод, позволяющий извлекать эффективные наблюдения из лабиринта, используя изображения с камеры.
Процесс обучения ИИ основан на обучении с подкреплением, основанном на модели, с использованием функции вознаграждения, определяемой прогрессом в прохождении лабиринта.
После обучения робот с искусственным интеллектом успешно преодолел лабиринт с коэффициентом успешности 76% и средним временем прохождения 15,73 секунды. Это немного лучше, чем лучший человеческий рекорд - 15,95 секунды.
Как проходило исследование
Система использует камеру для получения изображений сверху вниз, извлекая такие важные данные, как положение шара и расположение лабиринта. Машинное обучение Методы зеркального отображения наблюдений позволяют расширить обучающие данные, получить более разнообразные данные и улучшить обобщение.
Это исследование представляет собой значительный шаг вперед в применении ИИ в динамичных, реальных условиях. Команда ETH планирует открыть исходный код своего проекта, полагая, что их система может послужить ценным эталоном для дальнейших исследований в области ИИ благодаря низким требованиям к пространству, скромной стоимости и простой настройке оборудования.
Опубликованы дальнейшие результаты на этом сайте, а ниже вы можете посмотреть видеоролик о работе интригующей роботизированной системы.
Один из соавторов исследования, профессор Раффаэлло Д'Андреа, прокомментировал: "Мы считаем, что это идеальная тестовая площадка для исследований в области машинного обучения и ИИ в реальном мире. До появления CyberRunner исследования в этой области могли проводить только организации с большим бюджетом и специально созданной экспериментальной инфраструктурой".
"Теперь, заплатив менее 200 долларов, каждый может принять участие в передовых исследованиях в области ИИ. Более того, когда тысячи CyberRunners выйдут в реальный мир, можно будет проводить масштабные эксперименты, в которых обучение будет происходить параллельно, в глобальном масштабе. Это - высший пилотаж гражданской науки!"
Применение передовых систем искусственного интеллекта для создания практически полезных робототехнических систем вызывает огромный интерес. Недавно исследователи использовали ИИ для создания робота, способного автономное изготовление кислорода катализатора из образцов горных пород, а компания DeepMind сотрудничала в разработке автономная исследовательская лаборатория способных открывать и синтезировать соединения.
ИИ-робот ETH Zurich демонстрирует потенциал передовых методов ИИ в решении реальных задач, преодолевая разрыв между теоретическими возможностями ИИ и его практическим использованием в физических средах.
В будущем эти технологии объединятся, чтобы создать эффективные интеллектуальные роботизированные системы, которые будут автономно решать сложные реальные задачи.