Des chercheurs de l'ETH Zurich ont mis au point un système robotique capable de résoudre un jeu de labyrinthe du monde réel grâce à l'apprentissage par renforcement.
Comme indiqué dans le document leur étude "Apprentissage efficace par échantillonnage pour résoudre un jeu de labyrinthe dans le monde réel à l'aide d'un modèle d'apprentissage par renforcement basé sur les données", ce robot doté d'une IA a maîtrisé le jeu de labyrinthe BRIO en seulement cinq heures de données d'entraînement, surpassant ainsi toutes les tentatives antérieures connues.
Le jeu du labyrinthe BRIO, que certains connaissent peut-être, est un test de motricité fine et de raisonnement spatial qui demande aux joueurs de faire naviguer une bille d'acier dans un labyrinthe en inclinant le terrain de jeu.
Malgré son apparente simplicité, le jeu est complexe en raison de la relation entre la balle et les murs, des irrégularités de la surface et de la dynamique non linéaire du bouton de commande. Ces défis font du labyrinthe un terrain idéal pour l'application et l'évaluation de méthodes d'apprentissage robotique de pointe.
L'équipe de l'ETH Zurich, dirigée par Thomas Bi et le professeur Raffaello D'Andrea, a mis au point une méthode qui permet d'extraire des observations efficaces du labyrinthe à l'aide d'images de caméras.
Le processus d'apprentissage de l'IA est basé sur l'apprentissage par renforcement d'un modèle, à l'aide d'une fonction de récompense définie par la progression dans le labyrinthe.
Après l'entraînement, le robot IA a réussi à parcourir le labyrinthe avec un taux de réussite de 76% et un temps d'exécution moyen de 15,73 secondes. Ce résultat est légèrement supérieur au meilleur record humain de 15,95 secondes.
Fonctionnement de l'étude
Le système utilise une caméra pour capturer des images de haut en bas, extrayant des données cruciales telles que la position de la balle et le tracé du labyrinthe. Apprentissage automatique Les techniques d'observation en miroir permettent d'améliorer les données d'apprentissage, de générer des données plus diversifiées et d'améliorer la généralisation.
Cette recherche représente une avancée substantielle dans l'application de l'IA dans des environnements dynamiques et réels. L'équipe de l'ETH prévoit de mettre son projet en open source, estimant que son système pourrait servir de référence réelle précieuse pour d'autres recherches sur l'IA en raison de son faible encombrement, de son coût modeste et de la simplicité de sa configuration matérielle.
D'autres résultats sont publiés sur ce site, et vous pouvez regarder une vidéo du fonctionnement du système robotique intrigant ci-dessous.
L'un des coauteurs de l'étude, le professeur Raffaello D'Andrea, Nous pensons qu'il s'agit du banc d'essai idéal pour la recherche sur l'apprentissage automatique et l'IA dans le monde réel. Avant le CyberRunner, seules les organisations disposant d'un budget important et d'une infrastructure expérimentale sur mesure pouvaient mener des recherches dans ce domaine."
"Désormais, pour moins de 200 dollars, n'importe qui peut se lancer dans la recherche de pointe en matière d'IA. De plus, une fois que des milliers de CyberRunners seront dans le monde réel, il sera possible d'entreprendre des expériences à grande échelle, où l'apprentissage se fait en parallèle, à l'échelle mondiale. Le nec plus ultra de la science citoyenne !
L'application de systèmes d'IA avancés à des systèmes robotiques utiles dans la pratique suscite un vif intérêt. Des chercheurs ont récemment utilisé l'IA pour construire un robot capable de fabrication autonome d'une bouteille d'oxygène à partir d'échantillons de roches, et DeepMind a collaboré à un projet de recherche sur les catalyseurs. laboratoire de recherche autonome capable de découvrir et de synthétiser des composés.
Le robot d'IA de l'ETH Zurich démontre le potentiel des techniques d'IA avancées dans la résolution des défis du monde réel, en comblant le fossé entre les capacités théoriques de l'IA et son utilisation pratique dans des environnements physiques.
À l'avenir, ces technologies se combineront pour permettre la mise en place de systèmes robotiques efficaces et intelligents, capables de gérer de manière autonome des tâches complexes de la vie réelle.