Open X-Embodiment-dataset, RT-X-model een sprong voorwaarts voor AI-robots

5 oktober 2023

Google's DeepMind werkte samen met 33 verschillende academische laboratoria om een AI-trainingsdataset te maken op basis van 22 verschillende robottypes.

Robots zijn heel goed in het doen van één specifiek ding. Als je wilt dat de robot ook maar iets anders doet, moet hij helemaal opnieuw worden getraind. Het uiteindelijke doel voor robotica is om een robot te hebben die goed is in een algemene reeks handelingen met de mogelijkheid om zelf nieuwe vaardigheden te leren.

Om een AI-model te trainen heb je een grote dataset nodig met gegevens die gerelateerd zijn aan het doel van het model. Taalmodellen zoals GPT-4 worden getraind op grote hoeveelheden geschreven gegevens. Beeldgeneratoren zoals DALL-E 3 worden getraind op grote hoeveelheden afbeeldingen.

Met X-Embodiment heeft DeepMind een dataset gemaakt van robotacties gebaseerd op 22 verschillende soorten robots. Vervolgens heeft DeepMind die dataset gebruikt om nieuwe modellen te trainen op basis van zijn RT-1 en RT-2 robotmodellen.

De gegevens voor X-Embodiment waren afkomstig van "22 robotimodimenten, die meer dan 500 vaardigheden en 150.000 taken demonstreerden in meer dan 1 miljoen afleveringen", volgens DeepMind's bericht.

De eerdere testresultaten van de RT-1 en RT-2 modellen waren al indrukwekkend, maar DeepMind ontdekte dat de RT-X versies aanzienlijk beter presteerden door de algemene aard van de nieuwe dataset.

Bij het testen werd een robot bestuurd door een model dat getraind was voor een specifieke taak vergeleken met diezelfde robot bestuurd door het RT-1-X model. RT-1-X presteerde gemiddeld 50% beter dan de modellen die specifiek waren ontworpen voor taken zoals het openen van een deur of het leiden van een kabel.

RT-2, Google's vision-language-action (VLA) robotmodel, stelt robots in staat om te leren van web-, verbale en visuele gegevens en vervolgens te handelen zonder getraind te worden. Toen technici RT-2-X trainden met de X-Embodiment dataset ontdekten ze dat RT-2-X drie keer zo succesvol was als RT-2 voor nieuwe vaardigheden.

RT-2-X toont begrip van ruimtelijke relaties tussen objecten. Bron: DeepMind

Met andere woorden, de robot leerde nieuwe vaardigheden die hij voorheen niet had, gebaseerd op vaardigheden die andere robots hadden bijgedragen aan de dataset. De overdracht van vaardigheden tussen verschillende soorten robots zou een game-changer kunnen zijn voor de snelle ontwikkeling van robotica.

Deze resultaten geven reden tot optimisme dat we binnenkort robots zullen zien met meer algemene vaardigheden en het vermogen om nieuwe vaardigheden te leren zonder dat ze er specifiek voor getraind zijn.

DeepMind zegt dat dit onderzoek kan worden toegepast op de zelfverbeterende eigenschap van RoboCat, zijn zelfverbeterende AI-agent voor robotica.

Het vooruitzicht om een robot te hebben die zich blijft verbeteren en nieuwe vaardigheden blijft leren, zou een enorm voordeel zijn op gebieden zoals productie, landbouw of gezondheidszorg. Deze nieuwe vaardigheden zouden ook kunnen worden toegepast in de defensie-industrie wat misschien een minder aantrekkelijk, maar onvermijdelijk vooruitzicht is.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden