Googles DeepMind samarbetade med 33 olika akademiska laboratorier för att skapa ett AI-träningsdataset baserat på 22 olika robottyper.
Robotar är väldigt bra på att göra en specifik sak. Om du vill att den ska göra något som bara är lite annorlunda måste roboten tränas upp från grunden. Det ultimata målet för robotteknik är att ha en robot som är bra på en rad olika saker och som har förmågan att lära sig nya saker på egen hand.
För att träna en AI-modell behöver du ett stort dataset med data som är relaterade till modellens syfte. Språkmodeller som GPT-4 tränas på stora mängder skriven data. Bildgeneratorer som DALL-E 3 tränas på stora mängder bilder.
Med X-Embodiment har DeepMind skapat ett dataset med robothandlingar baserat på 22 olika typer av robotar. Sedan användes datasetet för att träna nya modeller baserade på robotmodellerna RT-1 och RT-2.
Uppgifterna för X-Embodiment härrörde från "22 robotförkroppsliganden som demonstrerade mer än 500 färdigheter och 150.000 uppgifter i mer än 1 miljon episoder", enligt DeepMinds inlägg.
Vi presenterar 𝗥𝗧-𝗫: en generalistisk AI-modell som hjälper till att utveckla hur robotar kan lära sig nya färdigheter. 🤖
För att träna den samarbetade vi med 33 akademiska laboratorier över hela världen för att bygga upp ett nytt dataset med erfarenheter från 22 olika robottyper.
Ta reda på mer om detta: https://t.co/k6tE62gQGP pic.twitter.com/IXTy2g4Lty
- Google DeepMind (@GoogleDeepMind) 3 oktober 2023
De tidigare testresultaten för RT-1 och RT-2 modeller var redan imponerande, men DeepMind fann att RT-X-versionerna presterade betydligt bättre på grund av den nya datasetets allmänna karaktär.
Testerna innebar att en robot som styrdes av en modell som tränats för en specifik uppgift jämfördes med samma robot som styrdes av RT-1-X-modellen. RT-1-X presterade i genomsnitt 50% bättre än de modeller som utformats specifikt för uppgifter som att öppna en dörr eller dra en kabel.
RT-2, Googles VLA-robotmodell (vision-language-action), gör det möjligt för robotar att lära sig från webbdata, verbala och visuella data och sedan agera utan att tränas. När ingenjörerna tränade RT-2-X med X-Embodiment-datasetet fann de att RT-2-X var tre gånger så framgångsrik som RT-2 när det gällde framväxande färdigheter.
Med andra ord lärde sig roboten nya färdigheter som den inte hade haft tidigare, baserat på förmågor som andra robotar hade bidragit med till datasetet. Överföring av färdigheter mellan olika typer av robotar skulle kunna vara en "game-changer" för snabb robotutveckling.
Dessa resultat ger anledning till optimism om att vi snart kommer att få se robotar med mer generella färdigheter samt förmågan att lära sig nya färdigheter utan att vara specifikt utbildade för dem.
DeepMind säger att denna forskning skulle kunna tillämpas på självförbättringsegenskapen hos RoboCat, dess självförbättrande AI-agent för robotteknik.
Möjligheten att ha en robot som fortsätter att förbättras och lära sig nya färdigheter skulle vara en enorm fördel inom områden som tillverkning, jordbruk och sjukvård. Dessa nya färdigheter skulle också kunna tillämpas i försvarsindustrin vilket kanske är ett mindre tilltalande, om än oundvikligt, perspektiv.