OpenAI: Det er "umuligt" at skabe AI-værktøjer uden at bruge ophavsretligt beskyttet materiale

8. januar 2024

OpenAI-forordning

I en erklæring om skriftlig dokumentation til det britiske overhus sagde OpenAI, at det er "umuligt" at skabe AI-værktøjer uden at bruge ophavsretligt beskyttet materiale.

Det sker midt i en intensiveret debat om ophavsrettens samspil med AI, hvor forfattere, skribenter og medier som New York Times har lagt sag an mod OpenAI, Microsoft, Stability AI, Anthropic, Google og Midjourney, for blot at nævne nogle få. 

Store sprogmodeller (LLM'er) som ChatGPT og billedgeneratorer som Midjourney, der for nylig ramte overskrifterne for at skabe en database med 16.000 kunstnere til modeltræning, er afhængige af omfattende ophavsretligt beskyttede data til deres træning. 

Faktisk udgør copyright-data grundlaget for AI-træningsmateriale, fordi det er rigeligt, dækker et bredt spektrum af menneskelig kreativitet og nemt kan hentes fra internettet. 

AI-virksomheder hævder, at disse data er "fair use" til deres modeltræning, men mange andre er uenige.  

Som svar til det britiske overhus' udvalg for kommunikation og digitalisering understregede OpenAI for nylig deres behov for ophavsretligt beskyttet materiale til uddannelse af LLM'er som GPT-4.

OpenAI udtalte: "Fordi ophavsret i dag dækker stort set alle former for menneskelige udtryk - herunder blogindlæg, fotografier, forumindlæg, stumper af softwarekode og regeringsdokumenter - ville det være umuligt at træne nutidens førende AI-modeller uden at bruge ophavsretligt beskyttet materiale."

Virksomheden argumenterede desuden for, at en begrænsning af undervisningsmaterialet til offentlige kilder ville resultere i dårlige AI-systemer. 

"At begrænse træningsdata til offentligt tilgængelige bøger og tegninger, der er skabt for mere end et århundrede siden, kan give et interessant eksperiment, men det vil ikke give AI-systemer, der opfylder behovene hos nutidens borgere", tilføjer OpenAI.

Du kan læse hele artiklen Indsendelse af skriftlige beviser her, som også berører AI's fremtidige udvikling, katastrofale risici, som OpenAI reklamerer for med deres Frontier Model Forum og beredskabsteam, og regulering. 

Offentligheden reagerer

Reaktionerne på disse udtalelser har ikke ligefrem været sympatiske.

Dr. Gary Marcus, som er en fremtrædende stemme i branchen, sagde for eksempel, at det i bund og grund stempler AI-modeller som en måde at tjene penge på stjålne copyright-værker.

Det virker faktisk, som om det næsten er en freudiansk smutter fra OpenAI's side, hvor de indrømmer, at deres forretningsmodel ikke kan fungere uden at manipulere med loven.

Der er en mærkbar følelse af uretfærdighed, når så få i Silicon Valleys øverste lag nyder godt af så manges arbejde.

OpenAI's erklæring hævder også, at de forstår "behovene" hos nutidens "borgere", hvilket afslører en voksende kløft mellem big tech's syn på generativ AI som et humanitært, endda filantropisk projekt og folks frygt for, at det stjæler deres data og fortrænger deres færdigheder.

Dr. Marcus kommenterede: "[AI-virksomheder] ...bør gå tilbage til tegnebrættet - og finde ud af, hvordan man bygger software, der ikke har et plagiatproblem - i stedet for at plyndre kunstnere, forfattere og andre indholdsleverandører." 

Sagsanlæggene hober sig op

Dette kommer også midt i flere retssager mod OpenAI, med bemærkelsesværdige forfattere som John Grisham, Jodi Picoult og George RR Martin sagsøgte virksomheden i september sidste år for påstået "systematisk tyveri i stor skala". 

To anerkendte journalister, Nicholas Gage og Nicholas Basbanes, indgav endnu en klage mod OpenAI og Microsoft i sidste ugeDet føjer sig til det voksende antal juridiske udfordringer, som AI-virksomheder står over for fra både forfatter- og billedkunstmiljøet.

OpenAI svarede også på New York Times' søgsmål og sagde, at de mener, at det er "uberettiget", som det ses nedenfor.

Denne udvikling giver anledning til bekymring for de potentielle juridiske forpligtelser, som AI-virksomheder kan komme til at stå over for i år og i fremtiden. Hvordan vil de tilpasse sig? Vil offentlighedens voksende modstand have nogen indflydelse på branchens udvikling?

Og hvordan kan man etisk træne generative AI-modeller i stor skala? Er etikken overhovedet kompatibel med teknologiens nuværende inkarnation? 

AI-virksomhedernes forsvar holder indtil videre, men kilen mellem AI-udviklernes ideer om 'fair use' og hvordan andre opfatter det, bliver større og større. 

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Sam Jeans

Sam er videnskabs- og teknologiforfatter og har arbejdet i forskellige AI-startups. Når han ikke skriver, kan han finde på at læse medicinske tidsskrifter eller grave i kasser med vinylplader.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser