Googles DeepMind arbejdede sammen med 33 forskellige akademiske laboratorier for at skabe et AI-træningsdatasæt baseret på 22 forskellige robottyper.
Robotter er virkelig gode til at gøre én bestemt ting. Hvis du vil have den til at gøre noget bare lidt anderledes, skal robotten trænes helt fra bunden. Det ultimative mål for robotteknologi er at have en robot, der er god til en lang række handlinger, og som selv kan lære nye færdigheder.
For at træne en AI-model har du brug for et stort datasæt med data, der er relateret til modellens formål. Sprogmodeller som GPT-4 er trænet på store mængder skriftlige data. Billedgeneratorer som DALL-E 3 er trænet på store mængder billeder.
Med X-Embodiment har DeepMind skabt et datasæt med robothandlinger baseret på 22 forskellige typer robotter. Derefter brugte de datasættet til at træne nye modeller baseret på deres RT-1- og RT-2-robotmodeller.
Dataene for X-Embodiment stammer fra "22 robotudførelsesformer, der demonstrerer mere end 500 færdigheder og 150.000 opgaver på tværs af mere end 1 million episoder", ifølge DeepMinds indlæg.
Vi præsenterer 𝗥𝗧-𝗫: en generalistisk AI-model, der hjælper med at fremme, hvordan robotter kan lære nye færdigheder. 🤖
For at træne den samarbejdede vi med 33 akademiske laboratorier over hele verden for at opbygge et nyt datasæt med erfaringer fra 22 forskellige robottyper.
Find ud af mere: https://t.co/k6tE62gQGP pic.twitter.com/IXTy2g4Lty
- Google DeepMind (@GoogleDeepMind) 3. oktober 2023
De tidligere testresultater af RT-1 og RT-2 modeller var allerede imponerende, men DeepMind fandt ud af, at RT-X-versionerne klarede sig betydeligt bedre på grund af det nye datasæts generelle karakter.
Testen bestod i at sammenligne en robot styret af en model, der var trænet til en bestemt opgave, med den samme robot styret af RT-1-X-modellen. RT-1-X klarede sig i gennemsnit 50% bedre end de modeller, der var designet specifikt til opgaver som at åbne en dør eller trække et kabel.
RT-2, Googles VLA-robotmodel (vision-language-action), gør det muligt for robotter at lære af web-, verbale og visuelle data og derefter handle uden at blive trænet. Da ingeniørerne trænede RT-2-X med X-Embodiment-datasættet, fandt de ud af, at RT-2-X var tre gange så succesfuld som RT-2, når det gjaldt nye færdigheder.
Med andre ord lærte robotten nye færdigheder, som den ikke havde før, baseret på evner, som andre robotter havde bidraget med til datasættet. Overførsel af færdigheder mellem forskellige typer robotter kan være en gamechanger for hurtig udvikling af robotteknologi.
Disse resultater giver anledning til optimisme om, at vi snart vil se robotter med mere generelle færdigheder samt evnen til at lære nye uden at være specifikt trænet til dem.
DeepMind siger, at denne forskning kan anvendes på selvforbedringsegenskaberne i RoboCat, dens selvforbedrende AI-agent til robotteknologi.
Udsigten til at have en robot, der bliver ved med at forbedre sig og lære nye færdigheder, ville være en stor fordel inden for områder som produktion, landbrug eller sundhedspleje. Disse nye færdigheder kunne også anvendes i Forsvarsindustrien hvilket måske er et mindre tiltalende, men uundgåeligt perspektiv.