DeepMind's RoboCat leert complexe taken van slechts 100 demonstraties

26 juni 2023

DeepMind-robot

Onderzoekers van DeepMind hebben AI gecombineerd met een geavanceerde robot die nieuwe taken kan leren van slechts 100 demonstraties. 

RoboCat, een baanbrekende robotische AI-agent, leert nieuwe taken op basis van slechts 100 demonstraties en verbetert zijn vaardigheden door zelf gegenereerde gegevens. 

Ondanks zijn naam is RoboCat een robotarm die is ontworpen om complexe taken uit te voeren, zoals het stapelen van verschillende gekleurde blokken in een bepaalde volgorde. Bekijk de demonstraties van DeepMind hieronder. 

De innovatieve, zichzelf verbeterende trainingscyclus van de robot betekent een belangrijke doorbraak op het gebied van robotica.

RoboCat gebruikt DeepMind's multimodale model Gatodie taal, beelden en acties kan verwerken in gesimuleerde en fysieke omgevingen. 

Voor de training van RoboCat stelden onderzoekers een enorme dataset samen van beeldsequenties en actiesets van verschillende robotarmen die honderden taken uitvoeren. Na de initiële training gaat RoboCat een "zelfverbeteringscyclus" in, waarbij hij nieuwe taken uitvoert, wat leidt tot verdere verfijning.

De cyclus bestaat uit de volgende stappen:

  1. Het verzamelen van 100 tot 1000 demonstraties van een nieuwe taak gedemonstreerd met een robotarm bediend door een mens.
  2. Fijnafstemming van RoboCat op de nieuwe taak om een gespecialiseerde agent te maken.
  3. De gespecialiseerde agent oefent vervolgens de nieuwe taak of arm ongeveer 10.000 keer, wat resulteert in het genereren van meer trainingsgegevens. 
  4. Zowel de demonstratiegegevens als de zelf gegenereerde gegevens worden vervolgens opgenomen in de bestaande dataset van RoboCat.
  5. Ten slotte wordt een bijgewerkte versie van RoboCat getraind met behulp van de uitgebreide dataset.

Dit proces van continue training en zelfverbetering betekent dat de dataset van RoboCat uitzonderlijk divers is. 

RoboCat past zich aan en leert van taken

RoboCat heeft met name bewezen zich aan te kunnen passen en leert snel nieuwe robotarmen te bedienen, sommige met andere configuraties dan waar hij in eerste instantie op getraind is.

Hoewel RoboCat's training in eerste instantie bestond uit armen met twee grijpers, paste hij zich bijvoorbeeld met succes aan aan een complexere arm met een grijper met drie vingers.

In één experiment, na het observeren van 1000 door mensen bestuurde demonstraties, manoeuvreerde RoboCat met succes een nieuwe arm om 86% van de tijd kleine tandwielen op te pakken. Hij paste zich ook aan om complexe taken op te lossen die precisie en begrip vereisen, zoals het juiste fruit uit een kom halen en het oplossen van een vormpuzzel.

De vaardigheden van RoboCat zijn niet beperkt - hij wordt steeds capabeler naarmate hij bijleert. 

De eerste versie van RoboCat geslaagd in het uitvoeren van ongeziene taken 36% van de tijd na het leren van 500 demonstraties per taak, terwijl de definitieve versie meer dan verdubbeld zijn succespercentage tot 74%.

RobotCat brengt ons een stap dichter bij het maken van veelzijdige robots voor algemeen gebruik. Snel leren, aanpassingsvermogen en zelfverbetering zijn voorwaarden om intelligente robots te bouwen die integreren in hun omgeving.

Het Gato-model van RobotCat is op dit moment beperkt tot een arm, maar dergelijke AI's zullen uiteindelijk meerdere ledematen besturen en hun omgeving waarnemen en erop reageren.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden