DeepMind dimostra SIMA, un agente AI generalista per ambienti 3D

14 marzo 2024

AI deepMind

Immaginate un'intelligenza artificiale che non si limiti a comprendere i comandi, ma li applichi, come farebbe un essere umano, in una serie di ambienti 3D simulati. 

Questo è l'obiettivo dell'agente scalabile, istruibile e multimondo (SIMA) di DeepMind. 

A differenza dell'IA tradizionale, che potrebbe eccellere in compiti discreti come i giochi strategici o la risoluzione di problemi specifici, gli agenti di SIMA sono addestrati a interpretare le istruzioni del linguaggio umano e a tradurle in azioni utilizzando una tastiera e un mouse, imitando l'interazione umana con un computer.

Ciò significa che, sia che si tratti di navigare in un paesaggio digitale, di risolvere enigmi o di interagire con gli oggetti di un gioco, SIMA mira a comprendere ed eseguire i comandi con la stessa intuizione e adattabilità di una persona.


Il nucleo di questo progetto è costituito da un enorme e diversificato set di dati di gioco umano in ambienti di ricerca e videogiochi commerciali. 

Il SIMA è stato addestrato e testato su una selezione di nove videogiochi grazie alla collaborazione con otto studi di videogiochi, tra cui titoli famosi come No Man's Sky e Teardown. Ogni gioco mette alla prova SIMA con abilità diverse, dalla navigazione di base e la raccolta di risorse ad attività più complesse come il crafting e il pilotaggio di astronavi.

L'addestramento del SIMA comprendeva quattro ambienti di ricerca per valutare le sue capacità di interazione fisica e di manipolazione degli oggetti.

In termini di architettura, SIMA utilizza modelli di visione e di predizione video pre-addestrati, messi a punto in base alle specifiche impostazioni 3D del suo portafoglio di giochi. 

A differenza delle tradizionali IA da gioco, SIMA non richiede l'accesso al codice sorgente o alle API personalizzate. Gestisce le immagini sullo schermo e le istruzioni fornite dall'utente, utilizzando le azioni della tastiera e del mouse per eseguire i compiti. 

Nella fase di valutazione, SIMA ha dimostrato di possedere 600 abilità di base che comprendono la navigazione, l'interazione con gli oggetti e l'uso dei menu. 

Ciò che distingue SIMA è la sua generalità. Questa IA non viene addestrata per padroneggiare un singolo gioco o risolvere un particolare insieme di problemi.

DeepMind gli sta invece insegnando ad adattarsi, a comprendere le istruzioni e ad agire in base ad esse in diversi mondi virtuali. 

Tim Harley di DeepMind ha spiegato: "È ancora un progetto di ricerca", ma in futuro "si potrebbe immaginare di avere agenti come SIMA che giocano con voi e con i vostri amici".


SIMA è padroneggiare l'arte di comprendere e agire in base alle nostre istruzioni, fondando il linguaggio sulla percezione e sull'azione. 

DeepMind ha un'ampia eredità di giochi che risale ai tempi di AlphaGo nel 2014che ha battuto diversi giocatori di alto profilo del famoso e complesso gioco asiatico Go.

Tuttavia, SIMA si spinge oltre i videogiochi, avvicinandosi al sogno di un sistema di istruzione veramente intelligente. Agenti AI che sfumano i confini tra la comprensione umana e quella della macchina. 

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Sam Jeans

Sam è uno scrittore di scienza e tecnologia che ha lavorato in diverse startup di intelligenza artificiale. Quando non scrive, lo si può trovare a leggere riviste mediche o a scavare tra scatole di dischi in vinile.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni