Google lanserer en rekke avanserte robotverktøy

5. januar 2024

Google DeepMind har lansert en rekke nye verktøy som skal hjelpe roboter med å lære raskere og mer effektivt i nye miljøer.

Å lære opp en robot til å utføre en bestemt oppgave i et enkelt miljø er en relativt enkel teknisk oppgave. Hvis roboter virkelig skal være nyttige for oss i fremtiden, må de kunne utføre en rekke generelle oppgaver og lære seg å gjøre dem i miljøer de ikke har opplevd før.

I fjor lanserte DeepMind sin RT-2 robotikk-kontrollmodell og RT-X robotdatasett. RT-2 oversetter tale- eller tekstkommandoer til robothandlinger.

De nye verktøyene DeepMind lanserte, bygger på RT-2 og bringer oss nærmere autonome roboter som utforsker ulike miljøer og lærer nye ferdigheter.

AutoRT

AutoRT kombinerer en grunnleggende stor språkmodell (LLM) med en visuell språkmodell (VLM) og en robotkontrollmodell som RT-2.

VLM gjør det mulig for roboten å vurdere scenen foran seg og sende beskrivelsen videre til LLM. LLM evaluerer de identifiserte objektene og scenen, og genererer deretter en liste over potensielle oppgaver som roboten kan utføre.

Oppgavene evalueres ut fra sikkerhet, robotens evner og hvorvidt det å utføre oppgaven vil tilføre nye ferdigheter eller mangfold til AutoRTs kunnskapsbase.

AutoRTs miljøanalyse og prosess for valg av oppgaver. Kilde: DeepMind

DeepMind sier at de med AutoRT "trygt orkestrerte så mange som 20 roboter samtidig, og opptil 52 unike roboter totalt, i en rekke kontorbygninger, og samlet inn et mangfoldig datasett bestående av 77 000 robotforsøk på tvers av 6 650 unike oppgaver".

Robotkonstitusjon

Når en robot sendes ut i nye omgivelser, vil den støte på potensielt farlige situasjoner som det ikke er mulig å planlegge spesifikt for. Ved å bruke en robotkonstitusjon som en veiledende guide får robotene generaliserte sikkerhetsrekkverk.

Robotens oppbygning er inspirert av Isaac Asimovs tre lover for robotikk:

  1. En robot kan ikke skade et menneske.
  2. Denne roboten skal ikke forsøke å utføre oppgaver som involverer mennesker, dyr eller levende ting. Denne roboten skal ikke samhandle med gjenstander som er skarpe, for eksempel en kniv.
  3. Denne roboten har bare én arm, og kan dermed ikke utføre oppgaver som krever to armer. Den kan for eksempel ikke åpne en flaske.

Ved å følge disse retningslinjene unngår roboten å velge en oppgave fra listen over alternativer som kan skade noen eller skade seg selv eller noe annet.

SARA-RT

SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers) tar modeller som RT-2 og gjør dem mer effektive.

Nevrale nettverk i RT-2 bygger på oppmerksomhetsmoduler med kvadratisk kompleksitet. Det betyr at hvis du dobler inndataene ved å legge til en ny sensor eller øke kameraoppløsningen, trenger du fire ganger så mange beregningsressurser.

SARA-RT bruker en lineær oppmerksomhetsmodell for å finjustere robotmodellen. Dette resulterte i en hastighetsforbedring på 14% og en nøyaktighetsgevinst på 10%.

RT-Trajectory

Det er komplisert å konvertere en enkel oppgave som å tørke av et bord til instruksjoner som en robot kan følge. Oppgaven må konverteres fra naturlig språk til en kodet sekvens av motorbevegelser og rotasjoner som skal drive robotens bevegelige deler.

RT-Trajectory legger til et visuelt 2D-overlegg på en treningsvideo, slik at roboten kan lære intuitivt hva slags bevegelse som kreves for å utføre oppgaven.

Så i stedet for bare å instruere roboten om å "rydde bordet", gir demonstrasjonen og bevegelsesoverlegget roboten en bedre sjanse til å lære den nye ferdigheten raskt.

DeepMind sier at en arm styrt av RT-Trajectory "oppnådde en suksessrate på 63%, sammenlignet med 29% for RT-2".

DeepMind gjør disse modellene og datasettene tilgjengelige for andre utviklere, så det blir interessant å se hvordan disse nye verktøyene fremskynder integreringen av AI-drevne roboter i hverdagen.

 

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser