Kunstnere og skabere sætter AI-udviklere til vægs på grund af potentielle krænkelser af ophavsretten.
Skriv en besked til en AI-billedgenerator som DALL-E, MidJourney eller Stable Diffusion, og den vil producere et tilsyneladende unikt billede i løbet af få sekunder.
På trods af deres tilsyneladende unikke karakterDisse billeder genereres ud fra milliarder af andre billeder via det, der kan beskrives som en kompleks digital collageteknik.
Kildebillederne er hentet fra 'offentlige' eller 'åbne' kilder.
Hvis du spørger ChatGPT, hvordan en billedgenerator som DALL-E fungerer, vil den sige noget i retning af: "Tænk på DALL-E som en superavanceret digital kunstner, der har set millioner af billeder og kan tegne et nyt ud fra din beskrivelse og forsøge at gøre det så nøjagtigt som muligt. Det gør den ved at blande og matche elementer, som den har lært af sine tidligere 'observationer'."
Det er lidt som at gå rundt i verdens kunstgallerier og tage billeder af hvert enkelt værk - bortset fra at man ikke kan blive smidt ud.
Internettet har ikke sikkerhedsvagter og kameraer, der holder øje med folk for at forhindre piratkopiering eller tyveri, og data scraping - som indebærer indsamling af data fra internettet ved hjælp af bots - har altid været et uklart juridisk område.
Kunstnere hævder, at træning af tekst-til-billede AI'er på offentlige datasæt svarer til verdens største kunstkup.
Hvordan får AI-detektorer kunstnere til at føle sig?
For nogle succesfulde kunstnere, hvis arbejde er blevet kopieret tusindvis - endda millioner af gange - har virkningerne af AI-genereret kunst gjort det vanskeligt at skelne mellem deres eget arbejde og AI-kopier.
De æstetiske forskelle er simpelthen for små, sandsynligvis fordi populære billeder optræder hyppigt i datasættene.
Blandt dem er Greg Rutowski, som sagde: "Mit arbejde er blevet brugt i AI mere end Picasso."
Rutowkis fantasy-illustrationer findes i franchises som Dungeons and Dragons og Magic: The Gathering og kan kopieres via tekst-til-billede-generatorer ved blot at tilføje kunstnerens navn til opgaven, f.eks. "Lav en drage, der kæmper mod en trold i Greg Rutowskis stil."
Han fortalte BBC"Den første måned, jeg opdagede det, indså jeg, at det helt klart vil påvirke min karriere, og at jeg ikke vil kunne genkende og finde mine egne værker på internettet", og han tilføjer: "Resultaterne vil være forbundet med mit navn, men det vil ikke være mit billede. Det vil ikke være skabt af mig. Så det vil skabe forvirring for folk, der opdager mine værker."
Han fortsatte: "Alt det, vi har arbejdet på i så mange år, er blevet taget fra os så let med AI."
Det sidste udsagn rammer virkelig plet, da AI's reproduktion af komplekse, talentfulde værker kun tager få sekunder, hvilket ikke kun betyder, at kunstnernes arbejde bliver overflødigt, men også at de færdigheder, der bruges til at skabe dem, går tabt.
Menneskehedens lningen af autentiske færdigheder og viden er en af AI's mest presserende risici, kaldet "svækkelse," illustreret af Disney-filmen WALL-E, hvor mennesker mister evnen til at bevæge sig på grund af teknologi.
En anden kunstner, der har udtalt sig om, at AI reproducerer deres værker, er Kelly McKernan, en illustrator fra Tennessee, som fandt ud af, at mere end 50 af hendes kunstværker var blevet opført som træningsdata på Large-scale Artificial Intelligence Open Network (LAION).
Du kan søge i omkring 5,8 milliarder billeder, der findes i AI-træningssæt, med værktøjet "Er jeg blevet trænet?", og det var sådan, McKernan faldt over hendes arbejde.
LAION er en non-profit organisation, der skaber open source-modeller og datasæt, hvoraf mange er blevet brugt til at træne højt profilerede tekst-til-billede-modeller, herunder Stable Diffusion og Imagen.
"Pludselig fik alle disse malerier, som jeg havde et personligt forhold til og en rejse med, en ny betydning, og det ændrede mit forhold til de kunstværker," siger McKernan.
Juridiske kampe er i gang
McKernan har sammen med kunstnerkollegerne Sarah Anderson og Karla Ortiz lagt sag an mod Stability AI, DeviantArt og Midjourney.
Deres søgsmål slutter sig til en strøm af retssager mod AI-virksomheder fra både forfattere og billedkunstnere.
Større virksomheder sagsøger eller planlægger at sagsøge AI-udviklere, herunder Getty Images, som hævdede, at Stability AI ulovligt havde kopieret og behandlet 12 millioner af deres billeder uden tilladelse.
McKernan sagde: "Som det er nu, kan ophavsretten kun gælde for hele mit billede. Jeg håber, at det [søgsmålet] fremmer beskyttelsen af kunstnere, så AI ikke kan bruges til at erstatte os. Hvis vi vinder, håber jeg, at mange kunstnere bliver betalt. Det er gratis arbejdskraft, og nogle mennesker tjener penge på at udnytte det."
McKernans stil, som ses nedenfor, er blevet efterspurgt i omkring 12.000 MidJourney-prompts.
Se dette opslag på Instagram
Et grundlæggende problem her er, at loven om ophavsret simpelthen ikke er bygget til AI-æraen.
Liam Budd fra fagforeningen for scenekunst og underholdning, Equity, argumenterede for opdaterede love, der afspejler de potentielle forretningsmuligheder, som generativ AI giver.
Han Udtalt"Vi har brug for mere klarhed i loven og kæmper for, at loven om ophavsret bliver opdateret."
Som svar på den stigende bølge af AI-drevne ophavsretskrænkelser har forskellige jurisdiktioner, som f.eks. EU, foreslået, at AI-udviklere skal offentliggøre alt ophavsretligt beskyttet materiale, der bruges til træning.
Vil det være nok? Har AI-udviklere allerede vist, at de sandsynligvis vil slippe af sted med det?
Når alt kommer til alt, er de fleste af disse datasæt allerede samlet, og AI-virksomheder kan argumentere for, at de blot opdaterer modeller for at omgå behovet for at deklarere copyright-materiale.
Har søgsmålene et solidt juridisk grundlag?
Denne nuværende runde af gruppesøgsmål drejer sig i høj grad om to argumenter.
- For det første påstanden om, at virksomhederne har krænket kunstnernes ophavsret ved at bruge deres værker uden tilladelse.
- For det andet påstanden om, at AI-outputtene i bund og grund er afledt indhold, fordi de indgår i træningsdataene.
Anvendelsen af disse argumenter varierer over hele verden, f.eks. i USA, hvor lovene om "fair use" generelt er mere liberale end i EU. Det komplicerer AI-ophavsretslandskabet yderligere. Hvis virksomheder f.eks. opererer i Storbritannien, kan de finde det mere udfordrende at argumentere for "fair use".
Derudover er det generative AI-firmaer, der sagsøges, ikke de enheder, der samler datasættene, som LAION i tilfældet med MidJourney. Eliana Torres, advokat for intellektuel ejendomsret hos advokatfirmaet Nixon Peabody, påpeger, at hvis LAION skabte datasættet, skete den påståede krænkelse på det tidspunkt, ikke da datasættet blev brugt til at træne modellerne.
Derefter er det en udfordring at bevise, at AI-genererede værker er reproduktioner af originale værker på grund af AI'ens komplekse natur, der bruger algoritmisk behandling til at nedbryde og samle billeder igen.
Tilsynsorganerne er blevet overrumplet af de juridiske konsekvenser af generativ AI, og selvom midlertidige løsninger som automatiserede filtre og opt-out-bestemmelser for kunstnere er ved at blive udviklet, er de måske ikke tilstrækkelige.
Indtil dommerne afsiger kendelser i individuelle sager, hvilket kan tage måneder, udsætter generative AI-virksomheder sig for betydelige juridiske risici i mange jurisdiktioner.
Historien viser, at loven om ophavsret kan tilpasses ny teknologi, men indtil der opstår enighed, er både kunstnere og AI-udviklere meget uvidende.
Dommere lægger en dæmper på retssager
Indtil videre har dommerne ikke givet kunstnerne meget at være optimistiske over.
For eksempel har den amerikanske distriktsdommer William Orrick sået tvivl om Kelly McKernan-sagen.
Ifølge dommer OrrickMcKernan og de andre sagsøgere skulle "fremlægge flere fakta" om den påståede krænkelse af ophavsretten og klart differentiere deres krav mod hver enkelt virksomhed (Stability AI, DeviantArt og Midjourney).
Orrick bemærkede, at systemerne var blevet trænet på "fem milliarder komprimerede billeder", så kunstnerne skal fremlægge stærkere beviser for, at deres værker specifikt var involveret i den påståede krænkelse af ophavsretten. A hjemmeside, der følger denne retssag har for nylig uploadet tekniske oplysninger om, hvordan disse modeller fungerer ved at interpolere indhold fra billeder i deres træningssæt.
Sagen er repræsenteret af Joseph Saveri advokatfirma, som også repræsenterer mindst 5 andre lignende sager mod AI-virksomheder.
Og igen er ophavsretten potentielt krænket ved dataindsamling snarere end ved generering.
Afsnit 1202(b) i USA's Digital Millennium Copyright Act "handler om identiske 'kopier ... af et værk' - ikke om spredte uddrag og tilpasninger," - at argumentere for, at værker bliver 'kopieret' af AI-modellens proces, er potentielt spinkelt.
Orricks synspunkter rejser også spørgsmål om ansvaret for virksomheder som MidJourney og DeviantArt, der inkorporerer Stable Diffusion-teknologi fra Stability AI i deres egne generative AI-systemer.
IHvis AI-udviklere som OpenAI, Meta osv. pålægges et vist ansvar for at krænke kunstneres ophavsret, er de sårbare over for yderligere retssager.
Forfattere og skribenter indleder også retssager
I en anden nylig retssagDen amerikanske komiker og forfatter Sarah Silverman og forfatterne Christopher Golden og Richard Kadrey hævder, at deres ord ulovligt er blevet brugt til at træne AI-modeller som ChatGPT og LLaMA.
Søgsmålet indeholder parallelle krav til dem, som billedkunstnere har fremsat, men denne gang er AI'erne trænet på offentlige tekstdata.
Søgsmålet hævder, at ChatGPT var i stand til præcist at opsummere bøger som Silvermans "The Bedwetter", Golden's "Ararat" og Kadrey's "Sandman Slim". Det afgørende er, at detaljeringsgraden i resuméerne ikke kan forklares med uddrag af bøgerne, der er uploadet på Wikipedia eller boghandlernes hjemmesider.
Sagsøgerne beskylder OpenAI og Meta for at bruge ophavsretligt beskyttede bøger fra "skyggebiblioteker" uden samtykke.
Skyggebiblioteker som Bibliotik, Library Genesis og Z-Library huser store mængder ulovligt kopieret information.
Selv om det er tydeligt, at AI-virksomheder har tjent penge på produkter ved hjælp af ophavsretligt beskyttet arbejde, har de flere lag af beskyttelse, herunder deres modellers iboende kompleksitet og den idiosynkratiske plads, de indtager i det moralske, etiske og juridiske landskab.
Hvad skal domstolene beslutte?
Mens myndighederne stadig overvejer reglerne omkring AI, kan dommerne få den første chance for at forme det fremtidige copyright-landskab.
Dette kunne resultere i et kludetæppe af lovgivning, der er begrænset af de specifikke forhold i hver enkelt sag og den jurisdiktion, hvor den blev afgjort.
I øjeblikket er der mange spørgsmål, der skal besvares, herunder:
Q1: Kræver træning af en model på ophavsretligt beskyttet materiale en licens?
- Fair brug vs. licensering: Domstolene skal måske afgøre, om midlertidig kopiering af data under træning falder ind under "fair use", som tillader brug uden licens. Dette kan afhænge af faktorer som formålet med kopieringen, arten af det ophavsretligt beskyttede værk, mængden og væsentligheden af den anvendte del og effekten på det ophavsretligt beskyttede værks markedsværdi.
- Internationale perspektiver: Forskellige jurisdiktioner kan have forskellige holdninger til dette spørgsmål. For eksempel kan EU's Copyright-direktiv blive fortolket anderledes end den amerikanske Copyright Act.
Spørgsmål 2: Krænker generativ AI-produktion ophavsretten til de materialer, som modellen blev trænet på?
- Bestemmelse af afledt arbejde: Er det generative output blot en transformation, eller skaber det faktisk et afledt værk, der krænker ophavsretten? Dette spørgsmål kan kræve en kompleks analyse af lighed og kreativitet.
- Spørgsmål om ansvar: Hvis der sker en krænkelse, hvem er så ansvarlig? Skaberen af den kunstige intelligens? Brugeren af AI'en? Distributøren?
Spørgsmål 3: Overtræder generativ AI restriktionerne for at fjerne, ændre eller forfalske oplysninger om ophavsret?
- Specifikke tilfælde: Analyse af specifikke algoritmer som Stable Diffusion kan være nødvendig for at afgøre, om genererede værker ved et uheld kan reproducere eller manipulere vandmærker eller andre oplysninger om ophavsret.
- Forsætlig vs. utilsigtet overtrædelse: Domstolene kan blive nødt til at afgøre, om der var en hensigt om at fjerne eller ændre oplysninger om ophavsret, eller om det var en utilsigtet konsekvens af AI'ens funktion.
Spørgsmål 4: Krænker det den pågældendes rettigheder at skabe et værk i en persons stil?
- Definition af retten til offentlighed: Offentlighedsretten varierer fra jurisdiktion til jurisdiktion. Domstolene kan blive nødt til at fortolke, om det at skabe værker i en persons stil er ensbetydende med at bruge vedkommendes billede eller identitet.
- Kommerciel vs. ikke-kommerciel brug: Anvendelsen kan variere afhængigt af, om AI'ens output bruges til kommerciel gevinst eller ej.
Q5: Hvordan gælder open source-licenser for træning af AI-modeller og distribution af det resulterende output?
- Forståelse af open source-licenser: Domstolene skal måske afgøre, hvordan open source-licenser gælder for AI-træningsdata og genererede output.
Lige nu mangler vi én ting: en afgørelse. Lige nu ville det være tåbeligt at forudsige, om umotiveret dataskrabning fortsat vil være acceptabelt. Hvis skaberne finder en sprække i AI-industriens juridiske panser, kan skaden blive betydelig. Men det ser ud til at være et stort hvis.
Når afgørelserne begynder at trænge igennem, og vi kommer tættere på, at lovgivningen træder i kraft, bør den fremtidige retning for AI blive klarere. - Indtil de næste udfordringer, vel at mærke.