DeepMind-Forscher haben KI mit einem ausgeklügelten Roboter kombiniert, der neue Aufgaben aus nur 100 Demonstrationen lernen kann.
RoboCat, ein bahnbrechender KI-Roboter, lernt neue Aufgaben aus nur 100 Demonstrationen und verbessert seine Fähigkeiten durch selbst generierte Daten.
Trotz seines Namens ist RoboCat ein Roboterarm, der komplexe Aufgaben wie das Stapeln verschiedenfarbiger Blöcke in einer bestimmten Reihenfolge ausführen kann. Sehen Sie sich unten die Demonstrationen von DeepMind an.
Der innovative, sich selbst verbessernde Trainingszyklus des Roboters stellt einen bedeutenden Durchbruch auf dem Gebiet der Robotik dar.
RoboCat nutzt Das multimodale Modell Gato von DeepMinddie Sprache, Bilder und Handlungen in simulierten und realen Umgebungen verarbeiten kann.
Für das Training von RoboCat haben die Forscher einen umfangreichen Datensatz mit Bildsequenzen und Aktionssätzen von verschiedenen Roboterarmen zusammengestellt, die Hunderte von Aufgaben ausführen. Nach dem anfänglichen Training tritt RoboCat in einen "Selbstverbesserungs"-Zyklus ein, in dem er neue Aufgaben bewältigt, was zu einer weiteren Verfeinerung führt.
Der Zyklus besteht aus den folgenden Schritten:
- Sammlung von 100 bis 1000 Demonstrationen einer neuen Aufgabe, die mit einem von einem Menschen bedienten Roboterarm vorgeführt wird.
- Feinabstimmung von RoboCat auf die neue Aufgabe, um einen spezialisierten Agenten zu schaffen.
- Der spezialisierte Agent übt dann die neue Aufgabe oder den neuen Arm etwa 10.000 Mal, wodurch weitere Trainingsdaten generiert werden.
- Sowohl die Demonstrationsdaten als auch die selbst erstellten Daten werden dann in den bestehenden Datensatz von RoboCat integriert.
- Schließlich wird eine aktualisierte Version von RoboCat unter Verwendung des erweiterten Datensatzes trainiert.
Dieser Prozess des kontinuierlichen Trainings und der Selbstverbesserung bedeutet, dass der Datensatz von RoboCat außergewöhnlich vielfältig ist.
RoboCat passt sich an und lernt aus Aufgaben
RoboCat hat sich als anpassungsfähig erwiesen und lernt schnell, neue Roboterarme zu bedienen, die teilweise andere Konfigurationen haben als die, für die er ursprünglich trainiert wurde.
Obwohl RoboCat zunächst mit Armen mit zweizinkigen Greifern trainiert wurde, hat er sich erfolgreich an einen komplexeren Arm mit einem Greifer mit drei Fingern angepasst.
In einem Experiment gelang es RoboCat nach 1000 von Menschen gesteuerten Vorführungen, einen neuen Arm so zu manövrieren, dass er in 86% der Zeit kleine Zahnräder aufheben konnte. Er konnte auch komplexe Aufgaben lösen, die Präzision und Verständnis erfordern, z. B. die richtige Frucht aus einer Schale herausnehmen und ein Puzzle zum Formenvergleich lösen.
Die Fähigkeiten von RoboCat stagnieren nicht, sondern werden durch Lernen immer besser.
Der ersten Version von RoboCat gelang es in 36% der Fälle, ungesehene Aufgaben zu lösen, nachdem sie aus 500 Demonstrationen pro Aufgabe gelernt hatte, während die endgültige Version ihre Erfolgsquote auf 74% mehr als verdoppelte.
RobotCat bringt uns der Entwicklung vielseitiger, universell einsetzbarer Roboter einen Schritt näher. Schnelles Lernen, Anpassungsfähigkeit und Selbstverbesserung sind Voraussetzungen für den Bau intelligenter Roboter, die sich in ihre Umgebung integrieren.
Während das Gato-Modell von RobotCat derzeit auf einen Arm beschränkt ist, wird eine solche KI in Zukunft mehrere Gliedmaßen steuern, die ihre Umgebung wahrnehmen und auf sie reagieren.