Forskere ved University of Texas i Austin har udviklet en innovativ ramme til at træne AI-modeller på stærkt beskadigede billeder.
Metoden er kendt som Ambient Diffusion og gør det muligt for AI-modeller at "hente inspiration" fra billeder. uden direkte kopiering af dem.
Konventionelle tekst-til-billede-modeller, der bruges af DALL-E, Midjourney og Stable Diffusion risikerer at krænke ophavsretten, fordi de er trænet på datasæt, der indeholder ophavsretligt beskyttede billeder, hvilket fører til, at de nogle gange utilsigtet kopierer disse billeder.
Ambient Diffusion vender det på hovedet ved at træne modeller med bevidst korrumperede data.
I undersøgelseForskerteamet, der omfatter Alex Dimakis og Giannis Daras fra afdelingen for elektro- og computerteknik på UT Austin og Constantinos Daskalakis fra MITtrænede en Stable Diffusion XL-model på et datasæt med 3.000 billeder af berømtheder.
Til at begynde med blev modellerne, der var trænet på rene data, observeret som åbenlyse kopier af træningseksemplerne.
Men da træningsdataene blev ødelagt - tilfældigt maskeret op til 90% af pixels - producerede modellen stadig unikke billeder af høj kvalitet.
Det betyder, at AI'en aldrig udsættes for genkendelige versioner af de originale billeder, hvilket forhindrer den i at kopiere dem.
"Vores rammer gør det muligt at kontrollere afvejningen mellem hukommelse og præstation," forklarede Giannis Darasen kandidatstuderende i datalogi, som ledede arbejdet.
"I takt med at graden af korruption under træningen øges, mindskes indlæringen af træningssættet."
Videnskabelige og medicinske anvendelser
Ambient Diffusion kan bruges til meget mere end at løse problemer med ophavsret.
Ifølge professor Adam Klivans, en af projektets samarbejdspartnere, "kan rammerne også vise sig at være nyttige til videnskabelige og medicinske anvendelser. Det gælder for stort set al forskning, hvor det er dyrt eller umuligt at have et komplet sæt ukorrumperede data, fra billeddannelse af sorte huller til visse typer MR-scanninger."
Det er især en fordel inden for områder med begrænset adgang til ukorrumperede data, som f.eks. astronomi og partikelfysik.
På disse og andre områder kan data være ekstremt støjende, af dårlig kvalitet eller sparsomme, hvilket betyder, at meningsfulde data er i stærkt undertal i forhold til ubrugelige data. Her ville det være nyttigt at lære modeller at bruge suboptimale data mere effektivt.
Hvis Ambient Diffusion-tilgangen blev yderligere forfinet, kunne AI-virksomheder skabe funktionelle tekst-til-billede-modeller, samtidig med at de respekterede de oprindelige indholdsskaberes rettigheder og forhindrede juridiske problemer.
Selv om det ikke ville løse problemerne med, at AI-billedværktøjer reducerer mængden af arbejde for rigtige kunstnere, ville det i det mindste beskytte deres værker mod at blive kopieret i outputs ved et uheld.