Forskere fra ETH Zürich har udviklet et robotsystem, der kan løse et labyrintspil i den virkelige verden ved hjælp af forstærkningslæring.
Som beskrevet i deres undersøgelse "Sample-Efficient Learning to Solve a Real-World Labyrinth Game Using Data-Augmented Model-Based Reinforcement Learning", denne AI-drevne robot mestrede BRIO-labyrintspillet på bare fem timers træningsdata, hvilket overgik alle kendte tidligere forsøg.
BRIO-labyrintspillet, som nogle måske kender, er en test af finmotorik og rumlig forståelse, hvor spillerne skal navigere en stålkugle gennem en labyrint ved at vippe spillepladen.
På trods af sin tilsyneladende enkelhed er spillet komplekst på grund af forholdet mellem bolden og væggene, uregelmæssigheder i overfladen og ikke-lineær dynamik i kontrolknapperne. Disse udfordringer gør labyrinten ideel til at anvende og evaluere avancerede robotindlæringsmetoder.
Teamet fra ETH Zürich, ledet af Thomas Bi og professor Raffaello D'Andrea, har udviklet en metode, der udtrækker effektive observationer fra labyrinten ved hjælp af kamerabilleder.
AI'ens læringsproces er baseret på modelbaseret forstærkningslæring med en belønningsfunktion, der er defineret af fremskridt gennem labyrinten.
Efter træningen navigerede AI-robotten med succes gennem labyrinten med en succesrate på 76% og en gennemsnitlig gennemførelsestid på 15,73 sekunder. Det er lidt bedre end den bedste menneskelige rekord på 15,95 sekunder.
Sådan fungerede undersøgelsen
Systemet bruger et kamera til at tage top-down-billeder og udtrække vigtige data som kuglens position og labyrintens layout. Maskinel indlæring teknikker spejlede observationer for at forbedre træningsdataene, generere mere forskelligartede data og forbedre generaliseringen.
Denne forskning er et stort skridt fremad i anvendelsen af kunstig intelligens i dynamiske miljøer i den virkelige verden. ETH-teamet planlægger at open source deres projekt og mener, at deres system kan tjene som et værdifuldt benchmark i den virkelige verden for yderligere AI-forskning på grund af dets lave pladsbehov, beskedne omkostninger og enkle hardwareopsætning.
Yderligere resultater er offentliggjort på denne hjemmeside, og du kan se en video af, hvordan det spændende robotsystem fungerer nedenfor.
En af undersøgelsens medforfattere, professor Raffaello D'Andrea, "Vi mener, at dette er den ideelle testbænk til forskning i maskinlæring og AI i den virkelige verden. Før CyberRunner var det kun organisationer med store budgetter og skræddersyet eksperimentel infrastruktur, der kunne udføre forskning inden for dette område."
"For mindre end 200 dollars kan alle nu deltage i banebrydende AI-forskning. Når tusindvis af CyberRunners er ude i den virkelige verden, vil det desuden være muligt at deltage i storstilede eksperimenter, hvor læring sker parallelt, på globalt plan. Det ultimative inden for Citizen Science!"
Der har været stor interesse for at anvende avancerede AI-systemer til praktisk anvendelige robotsystemer. Forskere brugte for nylig AI til at bygge en robot, der kunne Selvstændig fremstilling af ilt katalysator fra stenprøver, og DeepMind samarbejdede om en autonomt forskningslaboratorium i stand til at opdage og syntetisere forbindelser.
ETH Zurichs AI-robot demonstrerer potentialet i avancerede AI-teknikker til at løse udfordringer i den virkelige verden og bygger bro mellem AI's teoretiske muligheder og den praktiske anvendelse i fysiske miljøer.
I fremtiden vil disse teknologier mødes for at muliggøre effektive, intelligente robotsystemer, der selvstændigt håndterer komplekse opgaver i det virkelige liv.