Forskare bygger syntetisk hunddataset i GTA-V för att skapa 3D-modeller

3 mars 2024

hund ai

Forskare från University of Surrey har utvecklat en metod för att omvandla fotografier av hundar till detaljerade 3D-modeller. 

Träningsmaterialet? Inte riktiga hundar, utan snarare datorgenererade bilder från den virtuella världen i succéspelet Grand Theft Auto V (GTA V). 

Moira Shooter, en forskarstuderande som deltog i studien, delade av studien"Vår modell tränades på CGI-hundar - men vi kunde använda den för att skapa 3D-skelettmodeller från fotografier av riktiga djur. Det skulle kunna låta naturvårdare upptäcka skadade vilda djur eller hjälpa konstnärer att skapa mer realistiska djur i metaversen."

Hittills har metoderna för att lära AI om 3D-strukturer gått ut på att använda riktiga foton tillsammans med data om objektens faktiska 3D-positioner, ofta erhållna med hjälp av motion capture-teknik. 

Men när man tillämpar dessa tekniker på hundar eller andra djur är det ofta för många rörelser att följa, och det är svårt att få hundar att bete sig tillräckligt länge. 

För att bygga upp sitt hunddataset ändrade forskarna GTA V:s kod så att de mänskliga karaktärerna ersattes med hundavatarer genom en process som kallas "modding". 

Hundar
Exempel från datasetet med syntetiska hundar som genererats med GTA-V. Källor: Universitetet i Surrey.

Forskarna producerade 118 videor som fångade dessa virtuella hundar i olika handlingar - sittande, gående, skällande och springande - under olika miljöförhållanden.

Detta kulminerade i skapandet av "DigiDogs", en rik databas som innehåller 27.900 bilder av hundars rörelser, fångade på ett sätt som datainsamling i verkligheten inte hade tillåtit.

Med datasetet i handen använde nästa steg Metas DINOv2 AI-modell för sina starka generaliseringsförmågor och finjusterade den med DigiDogs för att exakt förutsäga 3D-poser från RGB-bilder med en enda vy.

Forskarna visade att träning med DigiDogs dataset resulterade i mer exakta och verklighetstrogna 3D-hundposeringar än träning med verkliga dataset, tack vare variationen i hundarnas utseenden och handlingar.

Modellens förbättrade prestanda bekräftades genom noggranna kvalitativa och kvantitativa utvärderingar.

AI-hundar
Modeller som tränats på det syntetiska datasetet DigiDogs visade förbättrad noggrannhet jämfört med de som endast tränats med det verkliga datasetet RGBD-Dogs. Du kan se detta här om du tittar noga på de förutspådda mappningarna (i rosa) jämfört med den grundläggande sanningen (i grönt), som förbättras på höger sida. Källa: Universitetet i Surrey.

Även om denna studie innebar ett stort steg framåt för 3D-djurmodellering, erkänner teamet att det finns mer arbete att göra, särskilt när det gäller att förbättra hur modellen förutsäger djupaspekten av bilderna (z-koordinaten). 

Shooter beskrev den potentiella effekten av deras arbete och sa: "3D-poser innehåller så mycket mer information än 2D-fotografier. Från ekologi till animering - den här snygga lösningen har så många möjliga användningsområden."

Den papper vann priset för bästa uppsats vid IEEE/CVF Winter Conference on Applications of Computer Vision.

Det öppnar dörren för bättre modellprestanda inom områden som naturvård och 3D-rendering av objekt för VR. 

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar