Os investigadores da ETH Zurich desenvolveram um sistema robótico capaz de resolver um jogo de labirinto do mundo real utilizando a aprendizagem por reforço.
Tal como descrito em o seu estudo "Sample-Efficient Learning to Solve a Real-World Labyrinth Game Using Data-Augmented Model-Based Reinforcement Learning", este robô com inteligência artificial dominou o jogo do labirinto BRIO em apenas cinco horas de dados de treino, superando todas as tentativas anteriores conhecidas.
O jogo do labirinto BRIO, que pode ser familiar para alguns, é um teste às capacidades motoras finas e ao raciocínio espacial que exige que os jogadores naveguem uma bola de aço através de um labirinto, inclinando o campo de jogo.
Apesar da sua aparente simplicidade, o jogo é complexo devido à relação entre a bola e as paredes, às irregularidades da superfície e à dinâmica não linear do botão de controlo. Estes desafios tornam o labirinto ideal para aplicar e avaliar os métodos de aprendizagem robótica mais avançados.
A equipa da ETH Zurich, liderada por Thomas Bi e pelo Professor Raffaello D'Andrea, desenvolveu um método que extrai observações eficientes do labirinto utilizando imagens de câmaras.
O processo de aprendizagem da IA baseia-se na aprendizagem por reforço baseada em modelos, utilizando uma função de recompensa definida pelo progresso através do labirinto.
Após o treino, o robô com IA navegou com sucesso no labirinto com uma taxa de sucesso de 76% e um tempo médio de conclusão de 15,73 segundos. Este tempo é ligeiramente melhor do que o melhor registo humano de 15,95 segundos.
Como funcionou o estudo
O sistema utiliza uma câmara para captar imagens de cima para baixo, extraindo dados cruciais como a posição da bola e a disposição do labirinto. Aprendizagem automática as técnicas espelham observações para melhorar os dados de treino, gerando dados mais diversificados e melhorando a generalização.
Esta investigação representa um passo em frente substancial na aplicação da IA em ambientes dinâmicos do mundo real. A equipa da ETH planeia tornar o seu projeto open-source, acreditando que o seu sistema poderá servir como uma valiosa referência no mundo real para futuras investigações sobre IA, devido aos seus baixos requisitos de espaço, custo modesto e configuração simples do hardware.
São publicados outros resultados neste sítio Web, e pode ver um vídeo sobre o funcionamento intrigante do sistema de robôs abaixo.
Um dos co-autores do estudo, o Prof. Raffaello D'Andrea, comentou: "Acreditamos que este é o banco de ensaio ideal para a investigação em aprendizagem automática e IA no mundo real. Antes do CyberRunner, apenas as organizações com grandes orçamentos e infra-estruturas experimentais personalizadas podiam realizar investigação nesta área."
"Agora, por menos de 200 dólares, qualquer pessoa pode dedicar-se à investigação de ponta em IA. Além disso, quando milhares de CyberRunners estiverem no mundo real, será possível realizar experiências em grande escala, onde a aprendizagem ocorre em paralelo, a uma escala global. A última palavra em ciência cidadã!
A aplicação de sistemas avançados de IA a sistemas robóticos úteis na prática tem suscitado um enorme interesse. Recentemente, os investigadores utilizaram a IA para construir um robô capaz de fabrico autónomo de um oxigénio catalisador a partir de amostras de rocha, e a DeepMind colaborou numa laboratório de investigação autónomo capaz de descobrir e sintetizar compostos.
O robô de IA da ETH Zurich demonstra o potencial das técnicas avançadas de IA na resolução de desafios do mundo real, colmatando o fosso entre as capacidades teóricas da IA e a sua utilização prática em ambientes físicos.
No futuro, estas tecnologias irão juntar-se para permitir sistemas robóticos eficientes e inteligentes que tratem autonomamente de tarefas complexas da vida real.