OpenAI: att skapa AI-verktyg utan att använda upphovsrättsskyddat material är "omöjligt"

8 januari 2024

OpenAI-förordningen

I en skriftlig redogörelse till det brittiska överhuset konstaterade OpenAI att det är "omöjligt" att skapa AI-verktyg utan att använda upphovsrättsskyddat material.

Detta kommer mitt i en intensifierad debatt kring upphovsrättens interaktion med AI, där författare, skribenter och medier som New York Times lämnar in stämningar mot OpenAI, Microsoft, Stability AI, Anthropic, Google och Midjourney, för att bara nämna några. 

Stora språkmodeller (LLM) som ChatGPT och bildgeneratorer som Midjourney, som nyligen fick rubriker för att ha skapat en databas med 16.000 konstnärer för modellträningsändamål, förlitar sig på omfattande upphovsrättsskyddade data för sin träning. 

Faktum är att upphovsrättsdata utgör grundpelaren i utbildningsmaterial för AI eftersom de är rikligt förekommande, täcker ett brett spektrum av mänsklig kreativitet och är lätta att hämta från internet. 

AI-företagen hävdar att dessa data är "rättvis användning" för deras modellutbildning, men många andra håller inte med.  

I ett svar till överhusets kommitté för kommunikation och digitalisering betonade OpenAI nyligen sitt behov av upphovsrättsskyddat material för utbildning av LLM:er som GPT-4.

OpenAI förklarade: "Eftersom upphovsrätten idag täcker praktiskt taget alla typer av mänskliga uttryck - inklusive blogginlägg, fotografier, foruminlägg, programkod och regeringsdokument - skulle det vara omöjligt att träna dagens ledande AI-modeller utan att använda upphovsrättsskyddat material."

Företaget hävdade vidare att en begränsning av utbildningsmaterial till offentliga källor skulle leda till dåliga AI-system. 

"Att begränsa utbildningsdata till offentliga böcker och teckningar som skapades för mer än ett sekel sedan kan ge ett intressant experiment, men skulle inte ge AI-system som uppfyller behoven hos dagens medborgare", tillade OpenAI.

Du kan läsa hela artikeln skriftlig bevisinlämning härsom också berör AI:s framtida utveckling, katastrofrisker, för vilka OpenAI annonserar sitt Frontier Model Forum and Preparedness team, och reglering. 

Allmänheten reagerar

Reaktionerna på dessa uttalanden har inte precis varit sympatiska.

Dr. Gary Marcus, en framträdande röst i branschen, sa till exempel att detta i princip självmärker AI-modeller som ett sätt att tjäna pengar på stulna upphovsrättsskyddade verk.

Det verkar faktiskt som om detta nästan är en freudiansk glidning från OpenAI: s sida, som medger att deras affärsmodell är omöjlig att arbeta utan att manipulera lagen.

Det finns en påtaglig känsla av orättvisa när så få i Silicon Valleys toppskikt drar nytta av så många andras arbete.

OpenAIs uttalande hävdar också att de förstår "behoven" hos dagens "medborgare", vilket avslöjar en allt större koppling mellan big tech: s syn på generativ AI som ett humanitärt, till och med filantropiskt projekt och människors rädsla för att det stjäl deras data och förskjuter deras kompetens.

Dr. Marcus kommenterade, "[AI-företag] ...borde gå tillbaka till ritbordet - och ta reda på hur man bygger programvara som inte har problem med plagiat - i stället för att plundra konstnärer, författare och andra innehållsleverantörer." 

Stämningarna hopar sig

Detta kommer också mitt i flera stämningar mot OpenAI, med anmärkningsvärda författare som John Grisham, Jodi Picoult och George RR Martin stämde företaget i september förra året för påstådd "systematisk stöld i stor skala". 

Två ansedda journalister, Nicholas Gage och Nicholas Basbanes, lämnade in ytterligare ett klagomål mot OpenAI och Microsoft förra veckanvilket bidrar till det växande antalet juridiska utmaningar som AI-företag ställs inför från både författar- och bildkonstvärlden.

OpenAI svarade också på New York Times stämning och uppgav att de anser att det är "utan meriter", se nedan.

Denna utveckling väcker farhågor om de potentiella juridiska skyldigheter som AI-företag kan ställas inför i år och i framtiden. Hur kommer de att anpassa sig? Kommer allmänhetens växande motstånd att ha någon inverkan på branschens utveckling?

Och hur kan man på ett etiskt sätt träna storskaliga generativa AI-modeller? Är etiken ens kompatibel med teknikens nuvarande inkarnation? 

AI-företagens försvar håller än så länge, men klyftan mellan AI-utvecklarnas idéer om "fair use" och hur andra uppfattar det blir allt större. 

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar