Forskere fra ETH Zürich har utviklet et robotsystem som kan løse et labyrintspill i den virkelige verden ved hjelp av forsterkningslæring.
Som beskrevet i deres studie "Sample-Efficient Learning to Solve a Real-World Labyrinth Game Using Data-Augmented Model-Based Reinforcement Learning", denne AI-drevne roboten mestret BRIO-labyrintspillet på bare fem timer med treningsdata, noe som overgikk alle kjente tidligere forsøk.
BRIO-labyrintspillet, som kanskje er kjent for noen, er en test av finmotorikk og romforståelse som krever at spillerne navigerer en stålkule gjennom en labyrint ved å vippe spillefeltet.
Til tross for at spillet tilsynelatende er enkelt, er det komplekst på grunn av forholdet mellom ballen og veggene, ujevnheter i overflaten og ikke-lineær dynamikk i kontrollknappene. Disse utfordringene gjør labyrinten ideell for å anvende og evaluere de nyeste metodene for robotlæring.
Teamet fra ETH Zürich, ledet av Thomas Bi og professor Raffaello D'Andrea, har utviklet en metode som trekker ut effektive observasjoner fra labyrinten ved hjelp av kamerabilder.
Den kunstige intelligensens læringsprosess er basert på modellbasert forsterkningslæring, med en belønningsfunksjon som defineres av fremdriften gjennom labyrinten.
Etter trening klarte AI-roboten å navigere gjennom labyrinten med en suksessrate på 76% og en gjennomsnittlig gjennomføringstid på 15,73 sekunder. Dette er litt bedre enn den beste menneskelige rekorden på 15,95 sekunder.
Hvordan studien fungerte
Systemet bruker et kamera til å ta bilder ovenfra og ned, og henter ut viktige data som ballens posisjon og labyrintens utforming. Maskinlæring teknikker speilet observasjoner for å forbedre treningsdataene, generere mer varierte data og forbedre generaliseringen.
Denne forskningen representerer et betydelig skritt fremover når det gjelder å anvende kunstig intelligens i dynamiske, virkelige miljøer. ETH-teamet planlegger å bruke åpen kildekode for prosjektet sitt, og mener at systemet deres kan fungere som en verdifull referanse for videre AI-forskning i den virkelige verden på grunn av det lave plassbehovet, de beskjedne kostnadene og det enkle maskinvareoppsettet.
Ytterligere funn er publisert på dette nettstedet, og du kan se en video av hvordan robotsystemet fungerer nedenfor.
En av studiens medforfattere, professor Raffaello D'Andrea, "Vi mener at dette er det ideelle testmiljøet for forskning på maskinlæring og kunstig intelligens i den virkelige verden. Før CyberRunner var det bare organisasjoner med store budsjetter og skreddersydd eksperimentell infrastruktur som kunne utføre forskning på dette området."
"For mindre enn 200 dollar kan hvem som helst nå delta i banebrytende AI-forskning. Når tusenvis av CyberRunners er ute i den virkelige verden, vil det dessuten være mulig å delta i storskalaeksperimenter, der læring skjer parallelt, på global skala. Det ultimate innen Citizen Science!"
Det har vært stor interesse for å bruke avanserte AI-systemer i praktisk anvendelige robotsystemer. Forskere har nylig brukt kunstig intelligens til å bygge en robot som kan autonomt å produsere en oksygen katalysator fra steinprøver, og DeepMind samarbeidet om en autonom forskningslab i stand til å oppdage og syntetisere forbindelser.
ETH Zürichs AI-robot demonstrerer potensialet i avanserte AI-teknikker når det gjelder å løse utfordringer i den virkelige verden, og bygger bro over gapet mellom AIs teoretiske evner og den praktiske bruken i fysiske miljøer.
I fremtiden vil disse teknologiene sammen muliggjøre effektive, intelligente robotsystemer som på egen hånd kan håndtere komplekse oppgaver i det virkelige liv.