DeepMind demonstreert SIMA, een generalistische AI-agent voor 3D-omgevingen

14 maart 2024

AI deepMind

Stel je een AI voor die niet alleen commando's begrijpt, maar ze ook toepast, zoals een mens dat zou doen, in een reeks gesimuleerde 3D-omgevingen. 

Dat is het doel van DeepMind's (Scalable, Instructable, Multiworld Agent (SIMA). 

In tegenstelling tot traditionele AI, die uitblinkt in discrete taken zoals strategische spellen of het oplossen van specifieke problemen, worden SIMA's agents getraind om instructies in menselijke taal te interpreteren en deze te vertalen naar acties met behulp van een toetsenbord en muis, waardoor menselijke interactie met een computer wordt nagebootst.

Dit betekent dat of de taak nu is om door een digitaal landschap te navigeren, puzzels op te lossen of interactie aan te gaan met objecten in een game, SIMA is erop gericht om deze opdrachten te begrijpen en uit te voeren met dezelfde intuïtie en aanpassingsvermogen als een mens dat zou doen.


De kern van dit project is een enorme en diverse dataset van menselijke gameplay in onderzoeksomgevingen en commerciële videogames. 

SIMA is getraind en getest op een selectie van negen videogames door samen te werken met acht gamestudio's, waaronder bekende titels als No Man's Sky en Teardown. Elk spel daagt SIMA uit met verschillende vaardigheden, van basisnavigatie en het verzamelen van grondstoffen tot complexere activiteiten zoals knutselen en het besturen van een ruimteschip.

De training van SIMA omvatte vier onderzoeksomgevingen om de fysieke interactie en objectmanipulatievaardigheden te beoordelen.

Qua architectuur maakt SIMA gebruik van voorgetrainde vision- en videovoorspellingsmodellen, afgestemd op de specifieke 3D-instellingen van het spelportfolio. 

In tegenstelling tot traditionele AI's die spellen spelen, heeft SIMA geen toegang tot broncode of aangepaste API's nodig. Het werkt met afbeeldingen op het scherm en instructies van de gebruiker en gebruikt toetsenbord- en muisacties om taken uit te voeren. 

In de evaluatiefase toonde SIMA vaardigheid in 600 basisvaardigheden, waaronder navigatie, objectinteractie en menugebruik. 

Wat SIMA onderscheidt is zijn algemeenheid. Deze AI wordt niet getraind om een enkel spel te beheersen of een bepaalde reeks problemen op te lossen.

In plaats daarvan leert DeepMind het om zich aan te passen, instructies te begrijpen en ernaar te handelen in verschillende virtuele werelden. 

Tim Harley van DeepMind legde uit: "Het is nog steeds een onderzoeksproject", maar in de toekomst "zou je je kunnen voorstellen dat agenten zoals SIMA op een dag naast je spelen in games met jou en je vrienden".


SIMA beheerst de kunst om onze instructies te begrijpen en ernaar te handelen door taal te verankeren in perceptie en actie. 

DeepMind heeft een rijk gaming-erfgoed dat teruggaat tot AlphaGo in 2014die vervolgens verschillende bekende spelers van het beroemde complexe Aziatische spel Go versloeg.

Echter, SIMA gaat verder dan videogames en komt dichter bij de droom van echt intelligente, instructieve AI-agenten die de grenzen tussen menselijk en machinaal begrip doen vervagen. 

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden