Des chercheurs de l'université de Stanford ont amélioré leur robot statique ALOHA en construisant une version entièrement mobile qui peut être entraînée à effectuer des tâches ménagères.
Pour qu'un robot soit utile dans une série de tâches généralisées, il doit pouvoir se déplacer et disposer d'une gamme complète de mouvements de précision pour ses bras. Nous avons vu des démonstrations impressionnantes de ce type de robots, comme l'Optimus de Tesla, mais ils sont souvent coûteux ou indisponibles.
L'année dernière, Tony Zhao a dirigé une équipe qui a développé ALOHA, un logiciel libre à faible coût pour contrôler un robot bimanuel, ou à deux bras. Les premières démonstrations des capacités d'ALOHA étaient impressionnantes, mais le robot était statique, ne fonctionnant que sur les objets placés devant lui sur un bureau.
Avec Mobile ALOHAL'équipe dirigée par Zhao et Zipeng Fu a créé un robot capable de naviguer dans un environnement complexe tel qu'une maison, ce qui ouvre la voie à une série de nouvelles applications.
Le robot était capable de faire cuire des aliments, d'essuyer un vin renversé sur un comptoir, de ranger des chaises ou d'appeler un ascenseur.
Certains de ces éléments peuvent sembler triviaux, mais il n'est pas facile de faire faire à un robot quelque chose comme appeler un ascenseur. Il doit se diriger vers l'ascenseur à partir de points de départ potentiellement différents, localiser avec précision un bouton de 2 cm x 2 cm, appuyer sur le bouton avec la bonne force, puis entrer dans l'ascenseur.
Apprentissage par imitation
La clé de l'apprentissage de nouvelles compétences par le robot est un processus d'apprentissage par imitation à partir de démonstrations humaines. Souvent, on utilise des vidéos ou des ensembles de données tels que RT-X de Google. Avec Mobile ALOHA, les chercheurs ont utilisé ces ensembles de données mais ont également adopté une approche différente. Le robot est équipé d'une interface qui permet à un opérateur d'être attaché à lui afin que l'opérateur puisse contrôler le robot pendant qu'il effectue une tâche.
Après avoir démontré une tâche 50 fois, l'interface d'attache peut être retirée et Mobile ALOHA accomplira la tâche avec succès jusqu'à 90% du temps.
L'apprentissage par imitation est très utile pour enseigner de nouvelles compétences aux robots, mais il présente ses propres difficultés, en particulier dans les domaines nécessitant une grande précision. Mobile ALOHA utilise un nouvel algorithme appelé Action Chunk with Transformers (ACT) que l'équipe de Zhao a développé l'année dernière.
L'algorithme ACT améliore l'efficacité en prédisant les actions par morceaux, ce qui réduit la complexité de la tâche.
Avec Mobile ALOHA, les chercheurs ont déclaré qu'ils étaient "les premiers à constater que le co-entraînement avec des ensembles de données de manipulation statiques améliore les performances et l'efficacité des données des politiques de manipulation mobile".
Cela signifie que les nombreux ensembles de données existants créés avec des robots statiques pourraient être très utiles pour la formation des robots mobiles.
Que vous ai-je dit il y a quelques jours ? 2024 est l'année de la robotique. Mobile-ALOHA est un robot à code source ouvert capable d'effectuer des tâches dextres et bimanuelles comme la préparation d'un repas (avec la téléopération d'un humain). Très bientôt, le matériel ne sera plus un goulot d'étranglement dans notre quête de... pic.twitter.com/vMi3XkqKeh
- Jim Fan (@DrJimFan) 4 janvier 2024
Accessible et abordable
Aussi impressionnantes que soient les démonstrations, le matériel prêt à l'emploi et le faible coût de la solution rendent Mobile ALOHA particulièrement intéressant.
Le robot est contrôlé par un ordinateur portable ordinaire équipé d'un GPU Nvidia 3070 Ti (8 Go de VRAM) et d'un processeur Intel i7-12800H. L'ordinateur portable reçoit des flux vidéo de trois webcams Logitech C922x RGB, chacune fonctionnant à une résolution de 480×640.
Le robot est alimenté par une batterie de 1,26 kWh qui sert également de poids d'équilibrage de 14 kg pour empêcher le robot de basculer.
La facture totale de Mobile ALOHA s'est élevée à $32 000. Ce n'est pas mal si l'on considère qu'il s'agit d'un prototype. S'il était mis en production, Mobile ALOHA pourrait coûter beaucoup moins cher que cela. Et le fait qu'il s'agisse d'un logiciel libre signifie que de multiples développements matériels pourraient bientôt être créés pour la plateforme, ce qui ferait encore baisser les coûts.
Elon Musk a prédit que le robot Optimus de Tesla sera finalement vendu au détail à environ $20k. Il n'y a toujours pas de bouton "ajouter au panier" sur le site web de Tesla, quel que soit le prix que vous seriez prêt à payer pour en acquérir un.
Avec Mobile ALOHA, nous disposons désormais d'une excellente solution logicielle et matérielle qui laisse présager que nous aurons des robots ménagers bien plus tôt que nous ne le pensions.