I en skriftlig redegjørelse til det britiske overhuset slo OpenAI fast at det er "umulig" å lage AI-verktøy uten å bruke opphavsrettslig beskyttet materiale.
Dette skjer midt i en stadig mer opphetet debatt om opphavsrettens samspill med kunstig intelligens, der forfattere, skribenter og medier som New York Times har gått til søksmål mot OpenAI, Microsoft, Stability AI, Anthropic, Google og Midjourney, for å nevne noen få.
Store språkmodeller (LLM) som ChatGPT og bildegeneratorer som Midjourney, som nylig skapte overskrifter for å ha laget en database med 16 000 kunstnere for modellopplæring, baserer seg på omfattende opphavsrettsbeskyttede data for opplæringen.
Opphavsrettslige data utgjør faktisk grunnpilarene i AI-opplæringsmateriale, fordi det er rikelig tilgjengelig, dekker et bredt spekter av menneskelig kreativitet og er lett å hente fra Internett.
AI-selskaper hevder at disse dataene er "rettferdig bruk" til modellopplæring, men mange andre er uenige i dette.
I et svar til House of Lords' komité for kommunikasjon og digitalisering understreket OpenAI nylig sitt behov for opphavsrettsbeskyttet materiale for opplæring i LLM-er som GPT-4.
OpenAI uttalte: "Fordi opphavsretten i dag dekker praktisk talt alle slags menneskelige uttrykk - inkludert blogginnlegg, fotografier, foruminnlegg, utklipp av programvarekode og offentlige dokumenter - ville det være umulig å trene opp dagens ledende AI-modeller uten å bruke opphavsrettsbeskyttet materiale."
Selskapet hevdet videre at en begrensning av opplæringsmateriellet til offentlige kilder ville resultere i dårlige AI-systemer.
"Å begrense opplæringsdataene til bøker og tegninger som ble laget for mer enn hundre år siden, kan gi et interessant eksperiment, men det vil ikke gi AI-systemer som oppfyller behovene til dagens borgere", legger OpenAI til.
Du kan lese hele artikkelen skriftlig bevisinnlevering her, som også berører den fremtidige utviklingen av AI, katastroferisikoer, som OpenAI reklamerer for sitt Frontier Model Forum and Preparedness-team, og regulering.
Offentligheten reagerer
Reaksjonene på disse uttalelsene har ikke akkurat vært velvillige.
Dr. Gary Marcus, for eksempel, en fremtredende stemme i bransjen, sa at dette i bunn og grunn stempler AI-modeller som en måte å tjene penger på stjålet opphavsrettslig beskyttet arbeid.
Det virker faktisk som om dette nærmest er en freudiansk glipp fra OpenAIs side, der de innrømmer at forretningsmodellen deres er umulig å gjennomføre uten å manipulere loven.
Det er en følbar følelse av urettferdighet når så få i Silicon Valleys toppsjikt nyter godt av arbeidet til så mange.
OpenAIs uttalelse hevder også at de forstår "behovene" til dagens "borgere", noe som avslører en økende avstand mellom big tech-teknologiens syn på generativ AI som et humanitært, til og med filantropisk prosjekt og folks frykt for at det stjeler dataene deres og fortrenger ferdighetene deres.
Dr. Marcus kommenterte: "[AI-selskaper] ...bør gå tilbake til tegnebrettet - og finne ut hvordan man kan bygge programvare som ikke har et plagiatproblem - i stedet for å flå kunstnere, forfattere og andre innholdsleverandører."
Nå vet vi hvorfor Sam Altman reiste verden rundt i fjor sommer for å møte verdens ledere: Selskapet hans kommer ikke til å gjøre det stort med mindre de kan overbevise myndighetene om å gi dem en av historiens største støtteordninger. https://t.co/Pcc8FchG1a
- Gary Marcus (@GaryMarcus) 8. januar 2024
Søksmålene hoper seg opp
Dette kommer også midt i flere søksmål mot OpenAI, med kjente forfattere som John Grisham, Jodi Picoult og George RR Martin saksøkte selskapet i september i fjor for påstått "systematisk tyveri i stor skala".
To anerkjente journalister, Nicholas Gage og Nicholas Basbanes, leverte inn nok en klage mot OpenAI og Microsoft i forrige ukeDette føyer seg inn i rekken av juridiske utfordringer som AI-selskaper står overfor, både fra skrivende og visuelle kunstmiljøer.
OpenAI har også svart på søksmålet fra New York Times, og sier at de mener det er "grunnløst", se nedenfor.
Vi bygger kunstig intelligens for å styrke mennesker, inkludert journalister.
Vår holdning til @nytimes søksmål:
- Opplæring er rettferdig bruk, men vi tilbyr en opt-out
- "Oppstøt" er en sjelden feil som vi kjører til null
- New York Times forteller ikke hele historienhttps://t.co/S6fSaDsfKb- OpenAI (@OpenAI) 8. januar 2024
Denne utviklingen gir grunn til bekymring for de potensielle juridiske forpliktelsene AI-selskaper kan bli stilt overfor i år og i fremtiden. Hvordan vil de tilpasse seg? Vil den økende motstanden i offentligheten ha noen innvirkning på bransjens utvikling?
Og hvordan kan man etisk sett trene generative AI-modeller i stor skala? Er etikken i det hele tatt forenlig med teknologiens nåværende inkarnasjon?
AI-selskapenes forsvar holder så langt, men kilen mellom AI-utviklernes oppfatning av "fair use" og hvordan andre oppfatter det, blir stadig større.