Forskere ved Googles DeepMind har nået en milepæl inden for robotteknologi ved med succes at træne 20 cm høje humanoide robotter til at spille fodboldkampe én mod én.
Deres undersøgelsei Science Robotics, beskriver, hvordan de brugte deep reinforcement learning (RL) til at lære robotterne komplekse bevægelses- og spilfærdigheder.
De kommercielt tilgængelige Robotis OP3-robotter lært at løbe, sparke, blokere, rejse sig efter fald og score mål - alt sammen uden manuel programmering.
I stedet har AI-agenter, der styrer robotterne, tilegnet sig disse evner ved at prøve sig frem i simulerede miljøer, styret af et belønningssystem.
Sådan fungerer robotfodboldsystemet:
- Først trænede de separate neurale netværk kaldet "færdighedspolitikker" til grundlæggende bevægelser som at gå, sparke og rejse sig op. Hver færdighed blev indlært i et fokuseret miljø, der belønnede robotten for at mestre den specifikke evne.
- Ved hjælp af en teknik, der kaldes politikdestillation, blev de individuelle færdighedspolitikker derefter slået sammen til et enkelt overordnet politiknetværk. Denne samlede politik kunne aktivere den rette færdighed afhængigt af situationen.
- Forskerne optimerede derefter masterpolitikken yderligere gennem selvspil, hvor robotten spillede simulerede kampe mod tidligere versioner af sig selv. Denne iterative proces førte til løbende forbedringer af strategi og gameplay.
- For at forberede politikken til brug i den virkelige verden blev det simulerede træningsmiljø randomiseret med hensyn til faktorer som friktion og robottens massefordeling. Det hjalp politikken med at blive mere robust over for fysiske variationer.
- Efter udelukkende at have trænet i simulering blev den færdige politik uploadet til rigtige OP3-robotter, som derefter spillede fysiske fodboldkampe uden behov for yderligere finjustering.
For at være ærlig skal du se det for at tro det, så se med her. Populærvidenskab's videoer nedenfor.
Som du kan se, er resultaterne ret bemærkelsesværdige - dynamiske og smidige, de drejer rundt for at skifte retning og koordinerer deres lemmer for at sparke og balancere samtidig.
DeepMind beskriver deres succes i artiklen: "Den resulterende agent udviser robuste og dynamiske bevægelsesfærdigheder, såsom hurtig genopretning af fald, gang, drejning og spark, og den skifter mellem dem på en jævn og effektiv måde. Den lærte også at forudse boldbevægelser og blokere modstanderens skud."
Sammenlignet med en mere standard regelbaseret politik, der var programmeret specifikt til OP3, leverede DeepMinds RL-tilgang en langt bedre præstation.
De AI-trænede robotter gik 181% hurtigere, vendte sig 302% hurtigere, kom sig 63% hurtigere efter fald og sparkede 34% hårdere til bolden.
Sammen med DeepMinds fremskridt inden for AI-optimeret fodboldtræning i samarbejde med Liverpool FC, fodbold, er vi sandsynligvis på vej mod en mere digitaliseret æra inden for sport.
Det er nok kun et spørgsmål om tid, før vi får en Robot League, hvor brugerdefinerede robotter dyster i højoktan konkurrencesport.