Onderzoekers trainen model om afbeeldingen te maken zonder auteursrechtelijk beschermd werk te 'zien'

21 mei 2024

  • Onderzoekers van de Universiteit van Texas trainden een beeldmodel op corrupte gegevens
  • Ondanks vervormde en gebroken beelden presteert het nog steeds bewonderenswaardig
  • Dit laat zien hoe beeldgeneratiemodellen kunnen leren zonder auteursrechtgegevens
Afbeelding genereren

Onderzoekers van de Universiteit van Texas in Austin hebben een innovatief raamwerk ontwikkeld voor het trainen van AI-modellen op zwaar beschadigde afbeeldingen. 

Deze methode, bekend als Ambient Diffusion, stelt AI-modellen in staat om 'inspiratie op te doen' uit afbeeldingen zonder ze rechtstreeks kopiëren.

Conventionele tekst-naar-beeld modellen gebruikt door DALL-E, Midjourney en Stable Diffusion lopen het risico op schending van auteursrechten omdat ze zijn getraind op datasets die afbeeldingen bevatten waarop auteursrechten rusten, waardoor ze deze afbeeldingen soms onbedoeld kopiëren. 

Ambient Diffusion draait dat om door modellen te trainen met opzettelijk corrupte gegevens.

In de onderzoekHet onderzoeksteam, waaronder Alex Dimakis en Giannis Daras van de afdeling Electrical and Computer Engineering van UT Austin en Constantinos Daskalakis van MITtrainde een Stable Diffusion XL-model op een dataset van 3.000 afbeeldingen van beroemdheden. 

In eerste instantie werd duidelijk waargenomen dat de modellen die op schone gegevens waren getraind, de trainingsvoorbeelden kopieerden. 

Toen de trainingsgegevens echter corrupt waren - waarbij willekeurig tot 90% van de pixels werd gemaskeerd - produceerde het model nog steeds unieke afbeeldingen van hoge kwaliteit.

Dit betekent dat de AI nooit wordt blootgesteld aan herkenbare versies van de originele afbeeldingen, waardoor hij ze niet kan kopiëren.

"Ons raamwerk maakt het mogelijk om de afweging tussen memoriseren en presteren te controleren," aldus de directeur. verklaarde Giannis Daras, een afgestudeerde student computerwetenschappen die het werk leidde. 

"Naarmate de mate van corruptie tijdens de training toeneemt, neemt de memorisatie van de trainingsset af."

Wetenschappelijke en medische toepassingen

Het gebruik van Ambient Diffusion gaat verder dan het oplossen van auteursrechtenkwesties. 

Volgens professor Adam Klivans, een van de medewerkers aan het project, "zou het raamwerk ook nuttig kunnen zijn voor wetenschappelijke en medische toepassingen. Dat geldt in principe voor elk onderzoek waarbij het duur of onmogelijk is om een volledige set van ongecorrumpeerde gegevens te hebben, van beeldvorming van zwarte gaten tot bepaalde soorten MRI-scans."

Dit is vooral nuttig op gebieden met beperkte toegang tot onbeschadigde gegevens, zoals astronomie en deeltjesfysica

In deze en andere vakgebieden kunnen gegevens extreem ruisachtig, van slechte kwaliteit of schaars zijn, waardoor zinvolle gegevens sterk in de minderheid zijn ten opzichte van nutteloze gegevens. Modellen aanleren om suboptimale gegevens efficiënter te gebruiken zou hier nuttig zijn.

Als de Ambient Diffusion-benadering verder verfijnd zou worden, zouden AI-bedrijven functionele tekst-naar-beeld-modellen kunnen maken en tegelijkertijd de rechten van de oorspronkelijke makers van de inhoud kunnen respecteren en juridische problemen kunnen voorkomen.

Hoewel dit de bezorgdheid dat AI-afbeeldingsprogramma's de hoeveelheid werk voor echte artiesten verminderen niet zou wegnemen, zou het op zijn minst hun werk beschermen tegen het per ongeluk kopiëren in outputs.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden