Исследователи DeepMind объединили искусственный интеллект со сложным роботом, который может обучаться новым задачам на основе всего лишь 100 демонстраций.
RoboCat, новаторский роботизированный агент искусственного интеллекта, обучается новым задачам всего на 100 демонстрациях, совершенствуя свои навыки за счет самогенерируемых данных.
Несмотря на свое название, RoboCat - это роботизированная рука, предназначенная для выполнения сложных задач, таких как укладка разноцветных блоков в определенном порядке. Демонстрации DeepMind смотрите ниже.
Инновационный самосовершенствующийся цикл обучения робота представляет собой значительный прорыв в области робототехники.
RoboCat использует Мультимодальная модель Gato от DeepMindОни могут обрабатывать язык, изображения и действия в симулированных и физических средах.
Для обучения RoboCat исследователи собрали массивную базу данных, содержащую последовательности изображений и наборы действий различных роботизированных рук, выполняющих сотни задач. После первоначального обучения RoboCat вступает в цикл "самосовершенствования", решая новые задачи, что приводит к дальнейшему совершенствованию.
Цикл состоит из следующих этапов:
- Сбор от 100 до 1000 демонстраций новой задачи с помощью роботизированной руки, управляемой человеком.
- Тонкая настройка RoboCat на новую задачу для создания специализированного агента.
- Затем специализированный агент отрабатывает новую задачу или руку около 10 000 раз, в результате чего генерируется больше обучающих данных.
- Демонстрационные данные и данные, полученные самостоятельно, затем включаются в существующий набор данных RoboCat.
- Наконец, обновленная версия RoboCat обучается на расширенном наборе данных.
Этот процесс непрерывного обучения и самосовершенствования означает, что набор данных RoboCat исключительно разнообразен.
RoboCat адаптируется и учится на основе заданий
RoboCat доказал свою способность к адаптации и быстро научился управлять новыми роботизированными манипуляторами, некоторые из которых имеют другую конфигурацию, чем та, на которой он был изначально обучен.
Например, хотя вначале RoboCat обучался на руках с двухпалыми захватами, он успешно адаптировался к более сложной руке с трехпалым захватом.
В одном из экспериментов, после 1000 демонстраций, проведенных под контролем человека, RoboCat успешно маневрировал новой рукой, чтобы взять маленькие шестеренки в 86% раз. Он также приспособился решать сложные задачи, требующие точности и понимания, такие как извлечение правильного фрукта из миски и решение головоломки по сопоставлению форм.
Способности RoboCat не иссякают - они растут по мере обучения.
Первоначальная версия RoboCat успешно справлялась с невидимыми задачами 36% раз после обучения на 500 демонстрациях для каждой задачи, в то время как финальная версия более чем удвоила свой показатель успешности до 74%.
RobotCat еще на один шаг приближает нас к созданию универсальных роботов общего назначения. Быстрое обучение, адаптация и самосовершенствование - необходимые условия для создания интеллектуальных роботов, интегрирующихся в окружающую среду.
Пока модель Gato от RobotCat ограничивается одной рукой, но со временем такие ИИ будут управлять несколькими конечностями, ощущая и реагируя на окружающую среду.