Forskare vid Stanford University har förbättrat sin statiska ALOHA-robot genom att bygga en helt mobil version som kan tränas att utföra hushållsuppgifter.
För att en robot ska vara användbar för en rad olika generella uppgifter måste den kunna röra sig och ha ett komplett utbud av precisionsrörelser för sina armar. Vi har sett några imponerande demonstrationer av detta med robotar som Teslas Optimus, men de är ofta dyra eller otillgängliga.
Förra året ledde Tony Zhao ett team som utvecklade ALOHA, A Low-cost Open-source HArdware system för att styra en bimanuell, eller tvåarmad, robot. De första demonstrationerna av ALOHA:s kapacitet var imponerande, men roboten var statisk och arbetade bara med föremål framför den på ett skrivbord.
Med Mobil ALOHAhar teamet under ledning av Zhao och Zipeng Fu skapat en robot som kan navigera genom en komplex miljö som ett hem, vilket öppnar upp för en rad nya tillämpningar.
Roboten kunde laga mat, torka bort ett vinspill från en bänk, ordna stolar eller ringa efter en hiss.
Vissa av dessa kan verka triviala, men att få en robot att göra något som att anropa en hiss är inte lätt. Den måste navigera till hissen från potentiellt olika startpunkter, exakt lokalisera en 2 cm x 2 cm stor knapp, trycka på knappen med precis rätt kraft och sedan gå in i hissen.
Imitation av lärande
Nyckeln till att roboten lär sig nya färdigheter är en process där den lär sig genom att imitera mänskliga demonstrationer. Ofta görs detta med hjälp av videor eller dataset som Googles RT-X. Med Mobile ALOHA använde forskarna dessa dataset men valde också ett annat tillvägagångssätt. Roboten är utrustad med ett gränssnitt som gör det möjligt att koppla en operatör till den så att operatören kan styra roboten medan den utför en uppgift.
Efter att ha demonstrerat en uppgift 50 gånger kan tether-gränssnittet tas bort och Mobile ALOHA kommer att utföra uppgiften med framgång upp till 90% av tiden.
Imitationsinlärning är till stor hjälp när robotar ska lära sig nya färdigheter, men det har sina egna utmaningar, särskilt inom områden som kräver hög precision. Mobile ALOHA använder en ny algoritm som heter Action Chunk with Transformers (ACT) som Zhaos team utvecklade förra året.
ACT-algoritmen ökar effektiviteten genom att förutse åtgärder i bitar, vilket minskar komplexiteten i uppgiften.
Med Mobile ALOHA säger forskarna att de var "först med att konstatera att co-training med statiska manipuleringsdataset förbättrar prestandan och dataeffektiviteten för mobila manipuleringspolicyer".
Det innebär att den stora mängd befintliga dataset som skapats med statiska robotar kan vara mycket användbara även för att träna mobila robotar.
Vad var det jag sa för några dagar sedan? 2024 är robotikens år. Mobile-ALOHA är en robot med öppen källkod som kan utföra fingerfärdiga, bimanuella uppgifter som att laga mat (med mänsklig teleoperation). Mycket snart kommer hårdvaran inte längre att vara en flaskhals i vår strävan att uppnå mänsklig nivå,... pic.twitter.com/vMi3XkqKeh
- Jim Fan (@DrJimFan) 4 januari 2024
Tillgänglig och prisvärd
Även om demonstrationerna är imponerande är Mobile ALOHA särskilt intressant tack vare den standardiserade hårdvaran och den låga kostnaden för lösningen.
Roboten styrs av en vanlig bärbar dator med en Nvidia 3070 Ti GPU (8GB VRAM) och en Intel i7-12800H processor. Den bärbara datorn tar emot videoströmmar från tre Logitech C922x RGB-webbkameror, var och en med en upplösning på 480×640.
Roboten drivs av ett batteri på 1,26 kWh som också fungerar som en 14 kg tung balansvikt för att förhindra att roboten välter.
Den totala notan för Mobile ALOHA uppgick till $32.000. Det är inte illa med tanke på att det här är en prototyp. Om den gick i produktion skulle Mobile ALOHA kunna vara mycket billigare än så. Och det faktum att det är öppen källkod innebär att det snart kan skapas flera hårdvaruutvecklingar för plattformen, vilket driver ner kostnaderna ytterligare.
Elon Musk förutspådde att Teslas Optimus-robot så småningom kommer att säljas till cirka $20k. Det finns fortfarande ingen "lägg till i kundvagn" -knappen på Teslas webbplats, men oavsett hur mycket du skulle vara villig att betala för en.
Med Mobile ALOHA har vi nu en fantastisk mjukvaru- och hårdvarulösning som antyder att vi kommer att ha robotstädare mycket tidigare än vi trodde.