Åpent X-Embodiment-datasett, RT-X-modellen er et sprang for AI-roboter

5. oktober 2023

Googles DeepMind samarbeidet med 33 ulike akademiske laboratorier for å lage et AI-treningsdatasett basert på 22 ulike robottyper.

Roboter er veldig gode til å gjøre én bestemt ting. Hvis du vil at den skal gjøre noe som er bare litt annerledes, må roboten trenes opp fra bunnen av. Det endelige målet for robotteknologi er å ha en robot som er god på et generelt spekter av handlinger, og som har evnen til å lære seg nye ferdigheter på egen hånd.

For å trene opp en AI-modell trenger du et stort datasett med data som er relatert til formålet med modellen. Språkmodeller som GPT-4 er opplært på store mengder skriftlige data. Bildegeneratorer som DALL-E 3 er trent opp på store mengder bilder.

Med X-Embodiment har DeepMind laget et datasett med robothandlinger basert på 22 ulike typer roboter. Deretter har DeepMind brukt dette datasettet til å trene opp nye modeller basert på robotmodellene RT-1 og RT-2.

Dataene for X-Embodiment ble hentet fra "22 robotutførelser, som demonstrerte mer enn 500 ferdigheter og 150 000 oppgaver gjennom mer enn 1 million episoder", ifølge DeepMinds innlegg.

De tidligere testresultatene fra RT-1 og RT-2-modeller var allerede imponerende, men DeepMind fant ut at RT-X-versjonene presterte betydelig bedre på grunn av det nye datasettets generelle karakter.

Testingen innebar å sammenligne en robot styrt av en modell som var trent for en bestemt oppgave, med den samme roboten styrt av RT-1-X-modellen. RT-1-X presterte i gjennomsnitt 50% bedre enn modellene som var utviklet spesielt for oppgaver som å åpne en dør eller trekke en kabel.

RT-2, Googles VLA-robotmodell (Vision-Language-Action), gjør det mulig for roboter å lære fra nettdata, verbale og visuelle data og deretter handle uten å bli trent. Da ingeniørene trente RT-2-X med X-Embodiment-datasettet, fant de ut at RT-2-X var tre ganger så vellykket som RT-2 når det gjaldt nye ferdigheter.

RT-2-X viser forståelse for romlige relasjoner mellom objekter. Kilde: DeepMind

Roboten lærte med andre ord nye ferdigheter den ikke hadde fra før, basert på evner som andre roboter hadde bidratt med til datasettet. Overføring av ferdigheter mellom ulike typer roboter kan være en game-changer for rask utvikling av robotteknologi.

Disse resultatene gir grunn til optimisme med tanke på at vi snart vil se roboter med mer generelle ferdigheter, samt evnen til å lære seg nye ferdigheter uten å ha fått spesifikk opplæring i dem.

DeepMind sier at denne forskningen kan brukes på selvforbedringsegenskapen til RoboCat, den selvforbedrende AI-agenten for robotteknologi.

Utsiktene til å ha en robot som fortsetter å forbedre seg og lære seg nye ferdigheter, vil være en stor fordel på områder som produksjon, landbruk eller helsevesen. Disse nye ferdighetene kan også brukes i forsvarsindustrien noe som kanskje er en mindre tiltalende, om enn uunngåelig mulighet.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser