Los investigadores de DeepMind han combinado la IA con un sofisticado robot capaz de aprender nuevas tareas a partir de tan solo 100 demostraciones.
RoboCat, un innovador agente robótico de IA, aprende nuevas tareas a partir de tan sólo 100 demostraciones, mejorando sus habilidades mediante datos autogenerados.
A pesar de su nombre, RoboCat es un brazo robótico diseñado para realizar tareas complejas, como apilar bloques de distintos colores en un orden determinado. Vea las demostraciones de DeepMind a continuación.
El innovador ciclo de entrenamiento de mejora automática del robot representa un avance significativo en el campo de la robótica.
RoboCat utiliza Gato, el modelo multimodal de DeepMindque puede procesar lenguaje, imágenes y acciones en entornos simulados y físicos.
Para entrenar a RoboCat, los investigadores recopilaron un enorme conjunto de datos de secuencias de imágenes y acciones de varios brazos robóticos que realizaban cientos de tareas. Tras el entrenamiento inicial, RoboCat entra en un ciclo de "autosuperación" en el que aborda nuevas tareas que le llevan a perfeccionarse.
El ciclo consta de los siguientes pasos:
- Recopilación de 100 a 1000 demostraciones de una nueva tarea realizada con un brazo robótico manejado por un humano.
- Puesta a punto de RoboCat en la nueva tarea para crear un agente especializado.
- A continuación, el agente especializado practica la nueva tarea o brazo unas 10.000 veces, lo que da lugar a la generación de más datos de entrenamiento.
- Tanto los datos de la demostración como los autogenerados se incorporan al conjunto de datos existente de RoboCat.
- Por último, se entrena una versión actualizada de RoboCat utilizando el conjunto de datos aumentado.
Este proceso de formación continua y superación personal significa que el conjunto de datos de RoboCat es excepcionalmente diverso.
RoboCat se adapta y aprende de las tareas
RoboCat ha demostrado su capacidad de adaptación y aprende rápidamente a manejar nuevos brazos robóticos, algunos con configuraciones distintas a las que se le enseñaron inicialmente.
Por ejemplo, aunque el entrenamiento de RoboCat consistió inicialmente en brazos con pinzas de dos dedos, se adaptó con éxito a un brazo más complejo con una pinza de tres dedos.
En un experimento, tras observar 1.000 demostraciones controladas por humanos, RoboCat maniobró con éxito un nuevo brazo para coger pequeños engranajes el 86% de las veces. También se adaptó para resolver tareas complejas que requerían precisión y comprensión, como extraer la fruta correcta de un cuenco y resolver un rompecabezas de emparejamiento de formas.
Las habilidades de RoboCat no se estancan, sino que aumentan a medida que aprende.
La versión inicial de RoboCat consiguió realizar tareas no vistas el 36% de las veces tras aprender de 500 demostraciones por tarea, mientras que la versión final duplicó con creces su tasa de éxito hasta 74%.
RobotCat nos acerca un paso más a la creación de robots versátiles y de uso general. El aprendizaje rápido, la adaptabilidad y la autosuperación son requisitos indispensables para construir robots inteligentes que se integren en su entorno.
Aunque el modelo Gato de RobotCat se limita actualmente a un brazo, este tipo de inteligencia artificial acabará controlando varias extremidades, detectando su entorno y reaccionando ante él.