Os investigadores da Universidade de Stanford melhoraram o seu robô estático ALOHA, construindo uma versão totalmente móvel que pode ser treinada para realizar tarefas domésticas.
Para que um robô seja útil numa série de tarefas generalizadas, precisa de ser capaz de se movimentar e de ter uma gama completa de movimentos de precisão para os seus braços. Já vimos algumas demonstrações impressionantes de robôs como o Optimus da Tesla, mas muitas vezes são caros ou não estão disponíveis.
No ano passado, Tony Zhao liderou uma equipa que desenvolveu o ALOHA, um sistema de HArdware de código aberto de baixo custo para controlar um robô bimanual, ou com dois braços. As primeiras demonstrações das capacidades do ALOHA foram impressionantes, mas o robô era estático, funcionando apenas com objectos à sua frente numa secretária.
Com ALOHA móvelA equipa liderada por Zhao e Zipeng Fu criou um robô capaz de navegar num ambiente complexo, como uma casa, para abrir um leque de novas aplicações.
O robô foi capaz de cozinhar alimentos, limpar um derrame de vinho de um balcão, arrumar cadeiras de forma organizada ou chamar um elevador.
Algumas delas podem parecer triviais, mas conseguir que um robô faça algo como chamar um elevador não é fácil. Tem de navegar até ao elevador a partir de pontos de partida potencialmente diferentes, localizar com precisão um botão de 2cmx2cm, premir o botão com a quantidade certa de força e depois entrar no elevador.
Aprendizagem por imitação
A chave para o robô aprender novas competências é um processo de aprendizagem por imitação a partir de demonstrações humanas. Muitas vezes, isto é feito utilizando vídeos ou conjuntos de dados como RT-X da Google. Com o Mobile ALOHA, os investigadores utilizaram esses conjuntos de dados, mas adoptaram também uma abordagem diferente. O robô está equipado com uma interface que permite que um operador seja ligado a ele, de modo a que o operador possa controlar o robô enquanto realiza uma tarefa.
Depois de demonstrar uma tarefa 50 vezes, a interface do cabo pode ser removida e o Mobile ALOHA concluirá com êxito a tarefa até 90% do tempo.
A aprendizagem por imitação é muito útil para ensinar novas competências aos robôs, mas tem o seu próprio conjunto de desafios, especialmente em domínios que exigem elevada precisão. O ALOHA móvel utiliza um novo algoritmo denominado Action Chunk with Transformers (ACT) que a equipa de Zhao desenvolveu no ano passado.
O algoritmo ACT aumenta a eficiência através da previsão de acções em blocos, o que reduz a complexidade da tarefa.
Com o Mobile ALOHA, os investigadores afirmaram ser "os primeiros a descobrir que a formação conjunta com conjuntos de dados de manipulação estática melhora o desempenho e a eficiência dos dados das políticas de manipulação móvel".
Isto significa que a abundância de conjuntos de dados existentes criados com robôs estáticos pode ser muito útil para treinar também os robôs móveis.
O que é que eu vos disse há uns dias atrás? 2024 é o ano da robótica. O Mobile-ALOHA é um hardware de robô de código aberto que pode realizar tarefas bimanuais com destreza, como cozinhar uma refeição (com teleoperação humana). Muito em breve, o hardware deixará de ser um obstáculo na busca de um nível humano,... pic.twitter.com/vMi3XkqKeh
- Jim Fan (@DrJimFan) 4 de janeiro de 2024
Acessível e económico
Por muito impressionantes que sejam as demonstrações, o hardware pronto a utilizar e o baixo custo da solução tornam o Mobile ALOHA especialmente interessante.
O robô é controlado por um computador portátil normal com uma GPU Nvidia 3070 Ti (8GB VRAM) e um processador Intel i7-12800H. O portátil recebe fluxos de vídeo de três webcams Logitech C922x RGB, cada uma com uma resolução de 480×640.
O robô é alimentado por uma bateria de 1,26 kWh que também serve como um peso de equilíbrio de 14 kg para evitar que o robô tombe.
A fatura total do Mobile ALOHA ascendeu a $32.000. Não é mau, tendo em conta que se trata de um protótipo. Se entrasse em produção, o Mobile ALOHA poderia ser muito mais barato do que isso. E o facto de ser de código aberto significa que, em breve, poderão ser criados vários desenvolvimentos de hardware para a plataforma, reduzindo ainda mais os custos.
Elon Musk previu que o robô Optimus da Tesla acabará por ser vendido a retalho por cerca de $20k. No entanto, ainda não existe um botão "adicionar ao carrinho de compras" no sítio Web da Tesla, independentemente do valor que esteja disposto a pagar por um.
Com o Mobile ALOHA, dispomos agora de uma excelente solução de software e hardware que deixa antever que teremos empregadas domésticas robóticas muito mais cedo do que pensávamos.