Forskere træner model til at skabe billeder uden at 'se' ophavsretligt beskyttet arbejde

21. maj 2024

  • Forskere ved University of Texas trænede en billedmodel på beskadigede data
  • På trods af at billederne er forvrængede og opbrudte, fungerer det stadig beundringsværdigt
  • Dette viser, hvordan billedgenereringsmodeller kan lære uden copyright-data
Generering af billeder

Forskere ved University of Texas i Austin har udviklet en innovativ ramme til at træne AI-modeller på stærkt beskadigede billeder. 

Metoden er kendt som Ambient Diffusion og gør det muligt for AI-modeller at "hente inspiration" fra billeder. uden direkte kopiering af dem.

Konventionelle tekst-til-billede-modeller, der bruges af DALL-E, Midjourney og Stable Diffusion risikerer at krænke ophavsretten, fordi de er trænet på datasæt, der indeholder ophavsretligt beskyttede billeder, hvilket fører til, at de nogle gange utilsigtet kopierer disse billeder. 

Ambient Diffusion vender det på hovedet ved at træne modeller med bevidst korrumperede data.

I undersøgelseForskerteamet, der omfatter Alex Dimakis og Giannis Daras fra afdelingen for elektro- og computerteknik på UT Austin og Constantinos Daskalakis fra MITtrænede en Stable Diffusion XL-model på et datasæt med 3.000 billeder af berømtheder. 

Til at begynde med blev modellerne, der var trænet på rene data, observeret som åbenlyse kopier af træningseksemplerne. 

Men da træningsdataene blev ødelagt - tilfældigt maskeret op til 90% af pixels - producerede modellen stadig unikke billeder af høj kvalitet.

Det betyder, at AI'en aldrig udsættes for genkendelige versioner af de originale billeder, hvilket forhindrer den i at kopiere dem.

"Vores rammer gør det muligt at kontrollere afvejningen mellem hukommelse og præstation," forklarede Giannis Darasen kandidatstuderende i datalogi, som ledede arbejdet. 

"I takt med at graden af korruption under træningen øges, mindskes indlæringen af træningssættet."

Videnskabelige og medicinske anvendelser

Ambient Diffusion kan bruges til meget mere end at løse problemer med ophavsret. 

Ifølge professor Adam Klivans, en af projektets samarbejdspartnere, "kan rammerne også vise sig at være nyttige til videnskabelige og medicinske anvendelser. Det gælder for stort set al forskning, hvor det er dyrt eller umuligt at have et komplet sæt ukorrumperede data, fra billeddannelse af sorte huller til visse typer MR-scanninger."

Det er især en fordel inden for områder med begrænset adgang til ukorrumperede data, som f.eks. astronomi og partikelfysik

På disse og andre områder kan data være ekstremt støjende, af dårlig kvalitet eller sparsomme, hvilket betyder, at meningsfulde data er i stærkt undertal i forhold til ubrugelige data. Her ville det være nyttigt at lære modeller at bruge suboptimale data mere effektivt.

Hvis Ambient Diffusion-tilgangen blev yderligere forfinet, kunne AI-virksomheder skabe funktionelle tekst-til-billede-modeller, samtidig med at de respekterede de oprindelige indholdsskaberes rettigheder og forhindrede juridiske problemer.

Selv om det ikke ville løse problemerne med, at AI-billedværktøjer reducerer mængden af arbejde for rigtige kunstnere, ville det i det mindste beskytte deres værker mod at blive kopieret i outputs ved et uheld.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Sam Jeans

Sam er videnskabs- og teknologiforfatter og har arbejdet i forskellige AI-startups. Når han ikke skriver, kan han finde på at læse medicinske tidsskrifter eller grave i kasser med vinylplader.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser