Kunstnere og opphavsmenn utfordrer AI-utviklere på grunn av potensielle brudd på opphavsretten.
Skriv inn en ledetekst i en AI-bildegenerator som DALL-E, MidJourney eller Stable Diffusion, og den vil produsere et tilsynelatende unikt bilde i løpet av få sekunder.
Til tross for at de tilsynelatende er unikeDisse bildene er generert fra milliarder av andre bilder ved hjelp av det som kan beskrives som en kompleks digital collageteknikk.
Kildebildene er hentet fra "offentlige" eller "åpne" kilder.
Hvis du spør ChatGPT om hvordan en bildegenerator som DALL-E fungerer, får du følgende svar: "Tenk på DALL-E som en superavansert digital kunstner, som har sett millioner av bilder og kan tegne et nytt basert på beskrivelsen din, i et forsøk på å gjøre det så nøyaktig som mulig. Den gjør dette ved å blande og matche elementer den har lært av sine tidligere 'observasjoner'."
Det er litt som å vandre rundt i verdens kunstgallerier og ta bilder av hvert eneste verk - bortsett fra at du ikke kan bli kastet ut.
Internett har ikke sikkerhetsvakter og kameraer som overvåker folk for å forhindre piratkopiering eller tyveri, og dataskraping - som innebærer å samle inn data fra Internett ved hjelp av roboter - har alltid vært et uklart juridisk område.
Kunstnere hevder at det å lære opp kunstig intelligens til å omdanne tekst til bilder på offentlige datasett tilsvarer verdens største kunstkup.
Hvordan får AI-detektorer kunstnere til å føle seg?
For noen suksessrike kunstnere, hvis verk har blitt kopiert tusenvis - til og med millioner - av ganger, har effekten av AI-generert kunst gjort det vanskelig å skille mellom deres egne verk og AI-kopier.
De estetiske forskjellene er rett og slett for små, sannsynligvis fordi populære bilder forekommer hyppig i datasettene.
Blant dem er Greg Rutowski, som sa: "Mitt arbeid har blitt brukt i AI mer enn Picasso."
Rutowkis fantasyillustrasjoner finnes i franchiser som Dungeons and Dragons og Magic: The Gathering, og kan kopieres via tekst-til-bilde-generatorer ved å legge til kunstnerens navn i ledeteksten, for eksempel: "Lag en drage som kjemper mot et troll i Greg Rutowskis stil."
Han fortalte BBC"Den første måneden jeg oppdaget det, innså jeg at det helt klart vil påvirke karrieren min, og at jeg ikke vil være i stand til å gjenkjenne og finne mine egne verk på internett", og legger til: "Resultatene vil bli forbundet med navnet mitt, men det vil ikke være mitt bilde. Det vil ikke være skapt av meg. Så det vil skape forvirring for folk som oppdager verkene mine."
Han fortsatte: "Alt det vi har jobbet med i så mange år, har blitt tatt fra oss så lett med kunstig intelligens."
Det siste utsagnet treffer godt, for når kunstig intelligens reproduserer komplekse, talentfulle verk på sekunder, blir ikke bare kunstnernes arbeid overflødig, men også ferdighetene som ble brukt til å skape dem, går tapt.
Menneskehetens loss av autentiske ferdigheter og kunnskap er en av AIs mest presserende risikoer, kalt "svekkelse," illustrert av Disney-filmen WALL-E, der mennesker mister evnen til å bevege seg på grunn av teknologi.
En annen kunstner som har uttalt seg om kunstig intelligens som reproduserer verkene deres, er Kelly McKernan, en illustratør fra Tennessee som oppdaget at mer enn 50 av kunstverkene hennes var oppført som treningsdata på Large-scale Artificial Intelligence Open Network (LAION).
Du kan søke i rundt 5,8 milliarder bilder som finnes i AI-treningssett med verktøyet "Har jeg fått opplæring?", og det var slik McKernan snublet over arbeidet hennes.
LAION er en ideell organisasjon som lager modeller og datasett med åpen kildekode, og mange av disse har blitt brukt til å trene opp høyprofilerte tekst-til-bilde-modeller, inkludert Stable Diffusion og Imagen.
"Plutselig fikk alle disse maleriene, som jeg hadde et personlig forhold til og en reise med, en ny betydning, og det endret mitt forhold til disse kunstverkene", sier McKernan.
Juridiske kamper er i gang
McKernan, sammen med kunstnerkollegaene Sarah Anderson og Karla Ortiz, har tatt rettslige skritt mot Stability AI, DeviantArt og Midjourney.
Søksmålet deres føyer seg inn i rekken av søksmål mot AI-selskaper fra både forfattere og billedkunstnere.
Større selskaper saksøker eller planlegger å saksøke AI-utviklere, deriblant Getty Images, som hevdet at Stability AI ulovlig hadde kopiert og behandlet 12 millioner av deres bilder uten tillatelse.
McKernan sa: "Slik det er nå, kan opphavsretten bare brukes på hele bildet mitt. Jeg håper det [søksmålet] bidrar til å beskytte kunstnere, slik at kunstig intelligens ikke kan brukes til å erstatte oss. Hvis vi vinner, håper jeg at mange kunstnere får betalt. Det er gratis arbeidskraft, og noen tjener penger på å utnytte det."
McKernans stil, som du ser nedenfor, har blitt etterspurt i rundt 12 000 MidJourney-oppfordringer.
Se dette innlegget på Instagram
Et grunnleggende problem her er at opphavsretten rett og slett ikke er laget for AI-æraen.
Liam Budd fra scenekunst- og underholdningsforbundet Equity argumenterte for oppdaterte lover som gjenspeiler de potensielle forretningsmulighetene generativ AI gir.
Han oppgitt"Vi trenger mer klarhet i loven, og vi kjemper for at åndsverkloven skal oppdateres."
Som svar på den økende bølgen av AI-drevne brudd på opphavsretten har flere jurisdiksjoner, blant annet EU, foreslått at AI-utviklere må oppgi alt opphavsrettsbeskyttet materiale som brukes til opplæring.
Vil det være nok? Har AI-utviklere allerede vist at de sannsynligvis vil komme unna med det?
De fleste av disse datasettene er tross alt allerede satt sammen, og AI-selskaper kan hevde at de bare oppdaterer modeller for å omgå behovet for å deklarere opphavsrettslig beskyttet materiale.
Har søksmålene et solid juridisk grunnlag?
Den nåværende runden med gruppesøksmål dreier seg i stor grad om to argumenter.
- For det første påstanden om at selskapene har krenket kunstnernes opphavsrett ved å bruke verkene deres uten tillatelse.
- For det andre påstanden om at AI-resultatene i hovedsak er avledet innhold fordi de inngår i opplæringsdataene.
Disse argumentene anvendes ulikt over hele verden, for eksempel i USA, der lovene om "fair use" generelt er mer liberale enn i EU. Dette kompliserer opphavsrettslandskapet for AI ytterligere. Hvis selskaper for eksempel driver virksomhet i Storbritannia, kan det være vanskeligere for dem å argumentere for "rimelig bruk".
I tillegg er det generative AI-firmaer som saksøkes, ikke enhetene som sammenstiller datasettene, som LAION i tilfellet MidJourney. Eliana Torres, advokat med ansvar for immaterielle rettigheter i advokatfirmaet Nixon Peabody, påpeker at hvis LAION opprettet datasettet, skjedde den påståtte overtredelsen på det tidspunktet, ikke da datasettet ble brukt til å trene opp modellene.
Det er utfordrende å bevise at AI-genererte verk er reproduksjoner av originale verk på grunn av AI-enes komplekse natur, som bruker algoritmisk prosessering for å bryte ned og sette sammen bilder på nytt.
Reguleringsorganene har blitt tatt på sengen av de juridiske implikasjonene av generativ AI, og selv om midlertidige løsninger som automatiserte filtre og opt-out-bestemmelser for kunstnere er under utvikling, er det ikke sikkert at de er tilstrekkelige.
Inntil dommere har avsagt dom i enkeltsaker, noe som kan ta måneder, utsetter generativ KI-virksomheter seg for betydelig juridisk risiko i mange jurisdiksjoner.
Historien viser at opphavsretten kan tilpasse seg ny teknologi, men inntil det er oppnådd konsensus, lever både kunstnere og AI-utviklere i uvisshet.
Dommere legger en demper på søksmål
Så langt har dommerne gitt kunstnerne lite å være optimistiske over.
For eksempel har den amerikanske distriktsdommeren William Orrick sådd tvil om Kelly McKernan-søksmålet.
Ifølge dommer OrrickMcKernan og de andre saksøkerne måtte "fremlegge flere fakta" om den påståtte opphavsrettskrenkelsen og tydelig differensiere kravene sine mot hvert selskap (Stability AI, DeviantArt og Midjourney).
Orrick bemerket at systemene hadde blitt trent på "fem milliarder komprimerte bilder", så kunstnerne må legge frem sterkere bevis for at deres verk spesifikt var involvert i det påståtte bruddet på opphavsretten. A nettsted som sporer dette søksmålet har nylig lastet opp teknisk informasjon om hvordan disse modellene fungerer ved å interpolere innhold fra bilder i treningssettet deres.
Saken er representert av Joseph Saveri advokatfirma, som også representerer minst fem andre lignende saker mot AI-selskaper.
Og igjen, opphavsretten kan bli krenket ved datainnsamling snarere enn ved datagenerering.
Paragraf 1202(b) i USAs Digital Millennium Copyright Act "handler om identiske 'kopier ... av et verk' - ikke om løsrevne utdrag og tilpasninger," - å hevde at verk blir 'kopiert' ved hjelp av AI-modellens prosess er potensielt spinkelt.
Orricks synspunkter reiser også spørsmål om ansvaret til selskaper som MidJourney og DeviantArt, som innlemmer Stable Diffusion-teknologi fra Stability AI i sine egne generative AI-systemer.
IHvis AI-utviklere, som OpenAI, Meta osv., får et visst ansvar for å ha krenket kunstneres opphavsrettigheter, er de sårbare for ytterligere søksmål.
Forfattere og skribenter innleder også søksmål
I en annen nylig søksmålhevder den amerikanske komikeren og forfatteren Sarah Silverman og forfatterne Christopher Golden og Richard Kadrey at ordene deres ble ulovlig brukt til å trene opp AI-modeller som ChatGPT og LLaMA.
Søksmålet inneholder parallelle krav til de som er fremmet av billedkunstnere, men denne gangen er AI-ene trent opp på offentlige tekstdata.
I søksmålet hevdes det at ChatGPT var i stand til å oppsummere bøker som Silvermans "The Bedwetter", Goldens "Ararat" og Kadreys "Sandman Slim" på en nøyaktig måte. Det avgjørende er at detaljnivået i sammendragene ikke kan forklares med utdrag av bøkene som er lastet opp på Wikipedia eller bokhandlernes nettsider.
Saksøkerne anklager OpenAI og Meta for å ha brukt opphavsrettsbeskyttede bøker fra "skyggebiblioteker" uten samtykke.
Skyggebibliotek, som Bibliotik, Library Genesis og Z-Library, huser store mengder ulovlig kopiert informasjon.
Selv om det er åpenbart at AI-selskaper har tjent penger på produkter ved hjelp av opphavsrettsbeskyttet arbeid, har de flere lag med beskyttelse, blant annet på grunn av modellenes iboende kompleksitet og den idiosynkratiske plassen de inntar i det moralske, etiske og juridiske landskapet.
Hva har domstolene å ta stilling til?
Mens myndighetene fortsatt diskuterer regler rundt kunstig intelligens, kan det hende at dommerne får den første muligheten til å forme det fremtidige opphavsrettslandskapet.
Dette kan resultere i et lappeteppe av lovgivning som er begrenset av de spesifikke forholdene i hver enkelt sak og den jurisdiksjonen den ble avgjort i.
Foreløpig er det mange spørsmål som må besvares, blant annet:
Spm. 1: Kreves det lisens for å trene en modell på opphavsrettsbeskyttet materiale?
- Rettferdig bruk vs. lisensiering: Domstolene må kanskje avgjøre om midlertidig kopiering av data under opplæring faller inn under "rimelig bruk", noe som vil tillate bruk uten lisens. Dette kan avhenge av faktorer som formålet med kopieringen, arten av det opphavsrettsbeskyttede verket, mengden og omfanget av den delen som brukes, og effekten på det opphavsrettsbeskyttede verkets markedsverdi.
- Internasjonale perspektiver: Ulike jurisdiksjoner kan ha ulike holdninger til dette spørsmålet. For eksempel kan EUs opphavsrettsdirektiv tolkes annerledes enn den amerikanske Copyright Act.
Spm. 2: Krenker generativ AI opphavsretten til materialet som modellen ble trent på?
- Fastsettelse av avledet arbeid: Er det generative resultatet bare en transformasjon, eller skaper det faktisk et avledet verk som krenker opphavsretten? Dette spørsmålet kan kreve en kompleks analyse av likhet og kreativitet.
- Ansvarsspørsmål: Hvis det foreligger en krenkelse, hvem er ansvarlig? Skaperen av den kunstige intelligensen? Brukeren av AI-en? Distributøren?
Spm. 3: Bryter generativ AI med restriksjonene mot å fjerne, endre eller forfalske informasjon om forvaltning av opphavsrett?
- Spesifikke tilfeller: Analyse av spesifikke algoritmer som Stable Diffusion kan være nødvendig for å avgjøre om genererte verk ved et uhell kan reprodusere eller manipulere vannmerker eller annen opphavsrettsinformasjon.
- Intensjon vs. utilsiktet overtredelse: Domstolene må kanskje avgjøre om det var en intensjon om å fjerne eller endre opphavsrettslig informasjon, eller om det var en utilsiktet konsekvens av AI-operasjonen.
Spm. 4: Krenker det å skape et verk i stil med en annen person vedkommendes rettigheter?
- Definisjon av retten til publisitet: Retten til publisitet varierer fra jurisdiksjon til jurisdiksjon. Domstolene kan måtte tolke hvorvidt det å skape verk i noens stil er ensbetydende med å bruke deres likhet eller identitet.
- Kommersiell vs. ikke-kommersiell bruk: Bruksområdet kan variere avhengig av om AI-resultatene brukes til kommersielle formål eller ikke.
Spørsmål 5: Hvordan gjelder lisenser med åpen kildekode for opplæring av AI-modeller og distribusjon av resultatene?
- Forstå lisensiering av åpen kildekode: Domstolene må kanskje avgjøre hvordan lisenser for åpen kildekode skal gjelde for AI-treningsdata og genererte resultater.
Akkurat nå mangler vi én ting: en kjennelse. Akkurat nå ville det være tåpelig å forutsi om umotivert dataskraping fortsatt vil være akseptabelt. Hvis skaperne finner en sprekk i AI-industriens juridiske rustning, kan skaden bli betydelig. Men det ser ut som et stort hvis.
Når dommene begynner å falle og vi nærmer oss ikrafttredelsen av regelverket, vil den fremtidige retningen for AI bli tydeligere - I hvert fall frem til neste sett med utfordringer.