DeepMind demuestra SIMA, un agente de IA generalista para entornos 3D

14 de marzo de 2024

IA deepMind

Imagine una IA que no sólo entienda órdenes, sino que las aplique, como lo haría un ser humano, en una serie de entornos tridimensionales simulados. 

Ese es el objetivo del Agente Multimundo Escalable e Instructable (SIMA) de DeepMind. 

A diferencia de la IA tradicional, que puede destacar en tareas discretas como juegos estratégicos o resolución de problemas concretos, los agentes de SIMA están entrenados para interpretar instrucciones en lenguaje humano y traducirlas en acciones mediante un teclado y un ratón, imitando la interacción humana con un ordenador.

Esto significa que, tanto si la tarea consiste en navegar por un paisaje digital como en resolver rompecabezas o interactuar con objetos en un juego, SIMA pretende comprender y ejecutar estas órdenes con la misma intuición y capacidad de adaptación que lo haría una persona.


El núcleo de este proyecto es un enorme y diverso conjunto de datos de jugabilidad humana en entornos de investigación y videojuegos comerciales. 

SIMA se formó y probó en una selección de nueve videojuegos a través de colaboraciones con ocho estudios de juegos, entre los que se incluyen títulos tan conocidos como No Man's Sky y Teardown. Cada juego desafía a SIMA con diferentes habilidades, desde la navegación básica y la recolección de recursos hasta actividades más complejas como la artesanía y el pilotaje de naves espaciales.

El entrenamiento de SIMA incluyó cuatro entornos de investigación para evaluar sus habilidades de interacción física y manipulación de objetos.

En cuanto a la arquitectura, SIMA utiliza modelos de visión y predicción de vídeo preentrenados y ajustados a las configuraciones 3D específicas de su cartera de juegos. 

A diferencia de las IA de juego tradicionales, SIMA no requiere acceso al código fuente ni API personalizadas. Funciona con imágenes en pantalla e instrucciones proporcionadas por el usuario, empleando acciones del teclado y el ratón para ejecutar las tareas. 

En su fase de evaluación, SIMA demostró su competencia en 600 habilidades básicas que abarcan la navegación, la interacción con objetos y el uso de menús. 

Lo que distingue a SIMA es su generalidad. Esta IA no se entrena para dominar un solo juego o resolver un conjunto concreto de problemas.

En cambio, DeepMind le está enseñando a ser adaptable, a entender instrucciones y a actuar en consecuencia en diferentes mundos virtuales. 

Tim Harley, de DeepMind, explicó: "Todavía es en gran medida un proyecto de investigación", pero en el futuro, "uno podría imaginarse un día teniendo agentes como SIMA jugando a tu lado en juegos contigo y con tus amigos".


SIMA es dominar el arte de comprender nuestras instrucciones y actuar en consecuencia, basando el lenguaje en la percepción y la acción. 

DeepMind tiene una larga tradición de juegos que se remonta a AlphaGo en 2014que llegó a derrotar a varios jugadores de alto nivel del famoso y complejo juego asiático Go.

Sin embargo, SIMA va más allá de los videojuegos y se acerca al sueño de un sistema realmente inteligente e instructivo. Agentes de IA que difuminan los límites entre la comprensión humana y la de las máquinas. 

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales