De kwaliteit van AI-afbeeldingsgeneratoren lijdt eronder als ze worden getraind op AI-gegenereerde gegevens

18 juli 2023

AI afbeelding generator

Een nieuw onderzoek toont aan dat het trainen van AI-afbeeldingsgeneratoren met AI-gegenereerde afbeeldingen uiteindelijk leidt tot een significante vermindering van de uitvoerkwaliteit. 

Baraniuk en zijn team lieten zien hoe deze problematische AI-trainingslus generatieve AI's beïnvloedt, waaronder StyleGAN en diffusiemodellen. Deze behoren tot de modellen die worden gebruikt voor AI-beeldgeneratoren zoals Stable Diffusion, DALL-E en MidJourney. 

In hun experimenttrainde het team de AI's op zowel door AI gegenereerde als echte afbeeldingen. 70.000 echte menselijke gezichten afkomstig van Flickr.

Toen elke AI werd getraind op zijn eigen AI-gegenereerde beelden, begonnen de uitvoerresultaten van de StyleGAN beeldgenerator vervormde en golvende visuele patronen te vertonen, terwijl de uitvoerresultaten van de diffusiebeeldgenerator waziger werden.

In beide gevallen resulteerde het trainen van AI's op door AI gegenereerde afbeeldingen in kwaliteitsverlies. 

Een van de onderzoek De auteurs, Richard Baraniuk van de Rice University in Texas, waarschuwen: "Er komt een glibberig pad naar het gebruik van synthetische gegevens, bewust of onbewust."

AI afbeelding generator
Hoe meer AI-modellen worden getraind op synthetische beelden, hoe onscherper hun resultaten worden. Bron: Universiteit van Rice.

Hoewel de afname in beeldkwaliteit werd verminderd door AI-gegenereerde beelden van hogere kwaliteit te selecteren voor training, leidde dit tot een verlies aan beelddiversiteit. 

De onderzoekers probeerden ook een vaste set echte afbeeldingen op te nemen in trainingssets die voornamelijk AI-gegenereerde afbeeldingen bevatten, een methode die soms wordt gebruikt om kleine trainingssets aan te vullen. 

Het lijkt onvermijdelijk dat hoe meer AI-gegenereerde gegevens in de trainingsdatasets terechtkomen, hoe slechter de output wordt. Het is gewoon een kwestie van wanneer.

Er werden redelijke resultaten behaald toen elke AI werd getraind op een mix van door de AI gegenereerde afbeeldingen en een constant veranderende set authentieke afbeeldingen. Dit hielp om de kwaliteit en diversiteit van de afbeeldingen te behouden.

Het is een uitdaging om een balans te vinden tussen kwantiteit en kwaliteit - synthetische beelden zijn potentieel onbeperkt in vergelijking met echte beelden, maar het gebruik ervan brengt kosten met zich mee. 

AI's raken door hun gegevens heen

AI's zijn hongerig naar gegevens, maar authentieke gegevens van hoge kwaliteit zijn een eindige bron. 

De bevindingen in dit onderzoek weerspiegelen soortgelijke studies voor het genereren van tekstwaar AI-outputs de neiging hebben te lijden wanneer modellen worden getraind op AI-gegenereerde tekst. 

De onderzoekers benadrukken dat kleinere organisaties met beperkte mogelijkheden om authentieke gegevens te verzamelen de grootste uitdagingen hebben om AI-gegenereerde beelden uit hun datasets te filteren. 

Bovendien wordt het probleem nog verergerd doordat het internet wordt overspoeld met AI-gegenereerde content, waardoor het verbluffend lastig wordt om te bepalen op welk type gegevens modellen zijn getraind. 

Sina Alemohammad, van Rice University, suggereert dat het ontwikkelen van watermerken om AI-gegenereerde afbeeldingen te identificeren zou kunnen helpen, maar waarschuwt dat verborgen watermerken die over het hoofd worden gezien de kwaliteit van AI-gegenereerde afbeeldingen kunnen aantasten.

Alemohammad concludeert: "Je bent verdoemd als je het doet en verdoemd als je het niet doet. Maar het is zeker beter om een watermerk op de afbeelding te zetten dan niet."

Er wordt druk gedebatteerd over de langetermijngevolgen van het consumeren van de output van AI, maar op dit moment moeten AI-ontwikkelaars oplossingen vinden om de kwaliteit van hun modellen te waarborgen.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden