I ricercatori di DeepMind hanno combinato l'intelligenza artificiale con un sofisticato robot in grado di imparare nuovi compiti a partire da appena 100 dimostrazioni.
RoboCat, un innovativo agente di intelligenza artificiale robotica, apprende nuovi compiti a partire da appena 100 dimostrazioni, migliorando le proprie capacità grazie ai dati autogenerati.
Nonostante il nome, RoboCat è un braccio robotico progettato per eseguire compiti complessi come impilare blocchi di colore diverso in un ordine particolare. Guardate le dimostrazioni di DeepMind qui sotto.
L'innovativo ciclo di addestramento auto-migliorativo del robot rappresenta una svolta significativa nel campo della robotica.
RoboCat utilizza Il modello multimodale Gato di DeepMindin grado di elaborare linguaggio, immagini e azioni in ambienti fisici e simulati.
Per l'addestramento di RoboCat, i ricercatori hanno curato un enorme set di sequenze di immagini e di azioni di vari bracci robotici che eseguono centinaia di compiti. Dopo l'addestramento iniziale, RoboCat entra in un ciclo di "auto-miglioramento", affrontando nuovi compiti che portano a un ulteriore perfezionamento.
Il ciclo consiste nelle seguenti fasi:
- Raccolta di 100-1000 dimostrazioni di un nuovo compito eseguito con un braccio robotico manovrato da un umano.
- Messa a punto di RoboCat sul nuovo compito per creare un agente specializzato.
- L'agente specializzato si esercita quindi a svolgere il nuovo compito o braccio per circa 10.000 volte, generando così altri dati di addestramento.
- Sia i dati dimostrativi che quelli autogenerati vengono poi incorporati nel set di dati esistenti di RoboCat.
- Infine, una versione aggiornata di RoboCat viene addestrata utilizzando il dataset aumentato.
Questo processo di formazione continua e di auto-miglioramento fa sì che il set di dati di RoboCat sia eccezionalmente vario.
RoboCat si adatta e impara dalle attività
In particolare, RoboCat si è dimostrato adattabile, imparando rapidamente a utilizzare nuovi bracci robotici, alcuni con configurazioni diverse da quelle su cui era stato addestrato inizialmente.
Ad esempio, sebbene l'addestramento di RoboCat prevedesse inizialmente bracci con pinze a due punte, si è adattato con successo a un braccio più complesso con una pinza a tre dita.
In un esperimento, dopo aver osservato 1000 dimostrazioni controllate dall'uomo, RoboCat ha manovrato con successo un nuovo braccio per raccogliere piccoli ingranaggi per l'86% del tempo. Si è anche adattato a risolvere compiti complessi che richiedono precisione e comprensione, come estrarre il frutto corretto da una ciotola e risolvere un puzzle di abbinamento di forme.
Le capacità di RoboCat non si esauriscono, ma aumentano man mano che impara.
La versione iniziale di RoboCat è riuscita a eseguire compiti non visti per il 36% del tempo dopo aver appreso da 500 dimostrazioni per compito, mentre la versione finale ha più che raddoppiato il tasso di successo a 74%.
RobotCat ci avvicina alla creazione di robot versatili e generici. L'apprendimento rapido, l'adattabilità e l'auto-miglioramento sono i prerequisiti per la costruzione di robot intelligenti che si integrano nel loro ambiente.
Mentre il modello Gato di RobotCat è attualmente limitato a un braccio, queste IA potranno controllare più arti, percependo e reagendo all'ambiente circostante.