Open X-Embodiment-datasæt, RT-X-model et spring for AI-robotter

5. oktober 2023

Googles DeepMind arbejdede sammen med 33 forskellige akademiske laboratorier for at skabe et AI-træningsdatasæt baseret på 22 forskellige robottyper.

Robotter er virkelig gode til at gøre én bestemt ting. Hvis du vil have den til at gøre noget bare lidt anderledes, skal robotten trænes helt fra bunden. Det ultimative mål for robotteknologi er at have en robot, der er god til en lang række handlinger, og som selv kan lære nye færdigheder.

For at træne en AI-model har du brug for et stort datasæt med data, der er relateret til modellens formål. Sprogmodeller som GPT-4 er trænet på store mængder skriftlige data. Billedgeneratorer som DALL-E 3 er trænet på store mængder billeder.

Med X-Embodiment har DeepMind skabt et datasæt med robothandlinger baseret på 22 forskellige typer robotter. Derefter brugte de datasættet til at træne nye modeller baseret på deres RT-1- og RT-2-robotmodeller.

Dataene for X-Embodiment stammer fra "22 robotudførelsesformer, der demonstrerer mere end 500 færdigheder og 150.000 opgaver på tværs af mere end 1 million episoder", ifølge DeepMinds indlæg.

De tidligere testresultater af RT-1 og RT-2 modeller var allerede imponerende, men DeepMind fandt ud af, at RT-X-versionerne klarede sig betydeligt bedre på grund af det nye datasæts generelle karakter.

Testen bestod i at sammenligne en robot styret af en model, der var trænet til en bestemt opgave, med den samme robot styret af RT-1-X-modellen. RT-1-X klarede sig i gennemsnit 50% bedre end de modeller, der var designet specifikt til opgaver som at åbne en dør eller trække et kabel.

RT-2, Googles VLA-robotmodel (vision-language-action), gør det muligt for robotter at lære af web-, verbale og visuelle data og derefter handle uden at blive trænet. Da ingeniørerne trænede RT-2-X med X-Embodiment-datasættet, fandt de ud af, at RT-2-X var tre gange så succesfuld som RT-2, når det gjaldt nye færdigheder.

RT-2-X demonstrerer en forståelse af rumlige forhold mellem objekter. Kilde: DeepMind

Med andre ord lærte robotten nye færdigheder, som den ikke havde før, baseret på evner, som andre robotter havde bidraget med til datasættet. Overførsel af færdigheder mellem forskellige typer robotter kan være en gamechanger for hurtig udvikling af robotteknologi.

Disse resultater giver anledning til optimisme om, at vi snart vil se robotter med mere generelle færdigheder samt evnen til at lære nye uden at være specifikt trænet til dem.

DeepMind siger, at denne forskning kan anvendes på selvforbedringsegenskaberne i RoboCat, dens selvforbedrende AI-agent til robotteknologi.

Udsigten til at have en robot, der bliver ved med at forbedre sig og lære nye færdigheder, ville være en stor fordel inden for områder som produktion, landbrug eller sundhedspleje. Disse nye færdigheder kunne også anvendes i Forsvarsindustrien hvilket måske er et mindre tiltalende, men uundgåeligt perspektiv.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser