DeepMinds RoboCat lærer komplekse oppgaver fra så få som 100 demonstrasjoner

26. juni 2023

DeepMind-roboten

DeepMind-forskere har kombinert kunstig intelligens med en sofistikert robot som kan lære seg nye oppgaver ut fra så få som 100 demonstrasjoner. 

RoboCat, en banebrytende robot-AI-agent, lærer nye oppgaver fra så få som 100 demonstrasjoner, og forbedrer ferdighetene sine gjennom selvgenererte data. 

Til tross for navnet er RoboCat en robotarm som er designet for å utføre komplekse oppgaver, som å stable forskjellige fargede blokker i en bestemt rekkefølge. Se DeepMinds demonstrasjoner nedenfor. 

Robotens innovative, selvforbedrende treningssyklus representerer et betydelig gjennombrudd innen robotteknologi.

RoboCat utnytter DeepMinds multimodale modell Gatosom kan behandle språk, bilder og handlinger i simulerte og fysiske miljøer. 

For å lære opp RoboCat har forskerne samlet et enormt datasett med bildesekvenser og handlingssett fra ulike robotarmer som utfører hundrevis av oppgaver. Etter den innledende treningen går RoboCat inn i en "selvforbedringssyklus" der den løser nye oppgaver, noe som fører til ytterligere forbedringer.

Syklusen består av følgende trinn:

  1. Innsamling av 100 til 1000 demonstrasjoner av en ny oppgave demonstrert med en robotarm som styres av et menneske.
  2. Finjusterer RoboCat på den nye oppgaven for å skape en spesialisert agent.
  3. Den spesialiserte agenten øver deretter på den nye oppgaven eller armen rundt 10 000 ganger, noe som resulterer i generering av mer treningsdata. 
  4. Både demonstrasjonsdataene og de egengenererte dataene blir deretter innlemmet i RoboCats eksisterende datasett.
  5. Til slutt trenes en oppdatert versjon av RoboCat ved hjelp av det utvidede datasettet.

Denne prosessen med kontinuerlig opplæring og selvforbedring betyr at RoboCats datasett er usedvanlig mangfoldig. 

RoboCat tilpasser seg og lærer av oppgavene

RoboCat har vist seg å være tilpasningsdyktig, og har raskt lært seg å betjene nye robotarmer, noen med andre konfigurasjoner enn den opprinnelig ble trent på.

Selv om RoboCats opplæring i utgangspunktet involverte armer med tofingrede gripere, klarte den for eksempel å tilpasse seg til en mer kompleks arm med trefingrede gripere.

I et eksperiment, etter å ha observert 1000 menneskestyrte demonstrasjoner, klarte RoboCat å manøvrere en ny arm for å plukke opp små tannhjul 86% av gangen. Den klarte også å løse komplekse oppgaver som krevde presisjon og forståelse, for eksempel å plukke ut riktig frukt fra en bolle og løse et puslespill med form-matching.

RoboCats evner stopper ikke opp - den blir stadig dyktigere etter hvert som den lærer. 

Den første versjonen av RoboCat klarte å utføre usette oppgaver 36% av tiden etter å ha lært av 500 demonstrasjoner per oppgave, mens den endelige versjonen mer enn doblet suksessraten til 74%.

RobotCat tar oss et skritt nærmere målet om å skape allsidige, allsidige roboter. Rask læring, tilpasningsevne og selvforbedring er en forutsetning for å bygge intelligente roboter som integreres i omgivelsene.

RobotCats Gato-modell er for øyeblikket begrenset til en arm, men etter hvert vil slike AI-er kunne styre flere lemmer, føle og reagere på omgivelsene.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Sam Jeans

Sam er en vitenskaps- og teknologiskribent som har jobbet i ulike oppstartsbedrifter innen kunstig intelligens. Når han ikke skriver, leser han medisinske tidsskrifter eller graver seg gjennom esker med vinylplater.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser