DeepMinds RoboCat lär sig komplexa uppgifter från så få som 100 demonstrationer

26 juni 2023

DeepMind-roboten

DeepMind-forskare har kombinerat AI med en sofistikerad robot som kan lära sig nya uppgifter från så få som 100 demonstrationer. 

RoboCat, en banbrytande robot-AI-agent, lär sig nya uppgifter från så få som 100 demonstrationer och förbättrar sina färdigheter genom självgenererad data. 

Trots sitt namn är RoboCat en robotarm som är utformad för att utföra komplexa uppgifter som att stapla olikfärgade block i en viss ordning. Se DeepMinds demonstrationer nedan. 

Robotens innovativa, självförbättrande träningscykel innebär ett betydande genombrott inom robottekniken.

RoboCat utnyttjar DeepMinds multimodala modell Gatosom kan bearbeta språk, bilder och handlingar i simulerade och fysiska miljöer. 

För RoboCats träning har forskarna sammanställt ett massivt dataset med bildsekvenser och action-set från olika robotarmar som utför hundratals uppgifter. Efter den inledande träningen går RoboCat in i en "självförbättringscykel" där den tar sig an nya uppgifter, vilket leder till ytterligare förfining.

Cykeln består av följande steg:

  1. Insamling av 100 till 1000 demonstrationer av en ny uppgift som demonstreras med en robotarm som styrs av en människa.
  2. Finjustera RoboCat på den nya uppgiften för att skapa en specialiserad agent.
  3. Den specialiserade agenten övar sedan på den nya uppgiften eller armen cirka 10.000 gånger, vilket resulterar i att mer träningsdata genereras. 
  4. Både demonstrationen och egengenererade data införlivas sedan i RoboCats befintliga dataset.
  5. Slutligen tränas en uppdaterad version av RoboCat med hjälp av det utökade datasetet.

Denna process med kontinuerlig utbildning och självförbättring innebär att RoboCats dataset är exceptionellt mångsidigt. 

RoboCat anpassar sig och lär sig av uppgifter

RoboCat har visat sig vara anpassningsbar och lär sig snabbt att använda nya robotarmar, vissa med andra konfigurationer än de som den ursprungligen utbildades på.

Till exempel, även om RoboCats träning inledningsvis omfattade armar med tvåfingrade grepp, anpassade den sig framgångsrikt till en mer komplex arm med ett trefingrat grepp.

I ett experiment, efter att ha observerat 1000 mänskligt styrda demonstrationer, manövrerade RoboCat framgångsrikt en ny arm för att plocka upp små kugghjul 86% av tiden. Den anpassade sig också för att lösa komplexa uppgifter som kräver precision och förståelse, till exempel att ta ut rätt frukt ur en skål och lösa ett form-matchningspussel.

RoboCats förmågor når inte någon platå - den blir alltmer kapabel i takt med att den lär sig. 

Den första versionen av RoboCat lyckades utföra okända uppgifter 36% av tiden efter att ha lärt sig från 500 demonstrationer per uppgift, medan den slutliga versionen mer än fördubblade sin framgångsgrad till 74%.

RobotCat tar oss ett steg närmare att skapa mångsidiga robotar för allmänna ändamål. Snabb inlärning, anpassningsförmåga och självförbättring är förutsättningar för att bygga intelligenta robotar som integreras i sin omgivning.

RobotCats Gato-modell är för närvarande begränsad till en arm, men sådana AI:er kommer så småningom att styra flera lemmar och känna av och reagera på sin omgivning.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar