RoboCat de DeepMind apprend des tâches complexes à partir de 100 démonstrations seulement

26 juin 2023

Robot DeepMind

Les chercheurs de DeepMind ont associé l'IA à un robot sophistiqué capable d'apprendre de nouvelles tâches à partir de 100 démonstrations seulement. 

RoboCat, un agent d'intelligence artificielle révolutionnaire, apprend de nouvelles tâches à partir de 100 démonstrations seulement, en améliorant ses compétences grâce aux données qu'il génère lui-même. 

Malgré son nom, RoboCat est un bras robotique conçu pour effectuer des tâches complexes, comme empiler des blocs de différentes couleurs dans un ordre particulier. Voir les démonstrations de DeepMind ci-dessous. 

Le cycle d'entraînement innovant du robot, qui s'améliore de lui-même, représente une avancée significative dans le domaine de la robotique.

RoboCat utilise Le modèle multimodal Gato de DeepMindqui peut traiter le langage, les images et les actions dans des environnements simulés et physiques. 

Pour l'entraînement de RoboCat, les chercheurs ont constitué un vaste ensemble de données de séquences d'images et d'actions provenant de différents bras robotisés effectuant des centaines de tâches. Après la formation initiale, RoboCat entre dans un cycle d'"auto-amélioration", s'attaquant à de nouvelles tâches, ce qui lui permet de se perfectionner.

Le cycle se compose des étapes suivantes :

  1. Collecte de 100 à 1000 démonstrations d'une nouvelle tâche effectuée avec un bras robotisé commandé par un humain.
  2. Ajustement de RoboCat à la nouvelle tâche pour créer un agent spécialisé.
  3. L'agent spécialisé s'exerce ensuite à la nouvelle tâche ou au nouveau bras environ 10 000 fois, ce qui permet de générer davantage de données de formation. 
  4. Les données de démonstration et les données autogénérées sont ensuite intégrées à l'ensemble de données existant de RoboCat.
  5. Enfin, une version actualisée de RoboCat est entraînée à l'aide de l'ensemble de données augmenté.

Ce processus de formation continue et d'auto-amélioration signifie que l'ensemble de données de RoboCat est exceptionnellement diversifié. 

RoboCat s'adapte et apprend de ses tâches

RoboCat s'est notamment révélé adaptable, apprenant rapidement à utiliser de nouveaux bras robotisés, dont certains avec des configurations différentes de celles sur lesquelles il avait été formé au départ.

Par exemple, bien que l'entraînement de RoboCat ait d'abord porté sur des bras dotés de pinces à deux doigts, il s'est adapté avec succès à un bras plus complexe doté d'une pince à trois doigts.

Lors d'une expérience, après avoir observé 1 000 démonstrations contrôlées par des humains, RoboCat a réussi à manœuvrer un nouveau bras pour saisir de petits engrenages 86% du temps. Il s'est également adapté pour résoudre des tâches complexes nécessitant de la précision et de la compréhension, comme extraire le bon fruit d'un bol et résoudre un puzzle de correspondance de formes.

Les capacités de RoboCat ne s'arrêtent pas : elles augmentent au fur et à mesure qu'il apprend. 

La version initiale de RoboCat a réussi à effectuer des tâches inédites 36% du temps après avoir appris à partir de 500 démonstrations par tâche, tandis que la version finale a plus que doublé son taux de réussite pour atteindre 74%.

RobotCat nous rapproche de la création de robots polyvalents à usage général. L'apprentissage rapide, l'adaptabilité et l'auto-amélioration sont des conditions préalables à la construction de robots intelligents qui s'intègrent dans leur environnement.

Alors que le modèle Gato de RobotCat est actuellement limité à un bras, de telles IA contrôleront à terme plusieurs membres, détectant et réagissant à leur environnement.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation