Hva, en til?!
OpenAI og Microsoft har blitt rammet av nok et søksmål, denne gangen mot de digitale mediene Raw Story, AlterNet og The Intercept på grunn av anklager om brudd på opphavsretten.
Disse har gått til sak mot teknologiduoen for å ha brukt opphavsrettsbeskyttet innhold uten å kreditere det i opplæringen av AI-teknologiene sine, og har krevd økonomisk kompensasjon og fjerning av innholdet fra AI-datasettene som brukes i opplæringen.
Det er en kjent historie og det andre søksmålet OpenAI har møtt i løpet av de siste 24 timene, da Elon Musk forsøker å saksøke selskapets grunnleggereGreg Brockman og Sam Altman, for å ha brutt selskapets stiftelsesavtale.
I det nye opphavsrettssøksmålet hevdes det at ChatGPT har brukt opphavsrettsbeskyttet journalistikk uten nødvendig kreditering eller sitering, med krav om minst $2 500 per krenkelse.
Den innlevering forklarer"Generative systemer for kunstig intelligens (AI) og store språkmodeller (LLM) læres opp ved hjelp av verk som er skapt av mennesker. AI-systemer og LLM-er tar inn enorme mengder menneskelig kreativitet og bruker den til å etterligne hvordan mennesker skriver og snakker. Disse treningssettene har inkludert hundretusener, om ikke millioner, av journalistiske verk."
Det krever også en fersk studie fra Copyleaks"Ifølge det prisbelønte nettstedet Copyleaks inneholdt nesten 60% av svarene fra de saksøktes GPT-3.5-produkt i en studie utført av Copyleaks en eller annen form for plagiert innhold, og over 45% inneholdt tekst som var identisk med allerede eksisterende innhold."
John Byrne, administrerende direktør og grunnlegger av Raw Story og eier av AlterNet, uttrykte i en dristig uttalelse den økende frustrasjonen over Big Techs praksis, og sa: "Det er på tide at nyhetsorganisasjoner slår tilbake mot Big Techs fortsatte forsøk på å tjene penger på andres arbeid. Big Tech har desimert journalistikken. Det er på tide at utgiverne tar et standpunkt."
I likhet med andre søksmål er hovedbekymringen her at AI-selskaper som OpenAI har trent opp modellene sine på store mengder data som de mener er "åpen kildekode", "offentlig tilgjengelig" eller "fair use".
Problemet er at disse begrepene er svært tvetydige. Opphavsrettsloven ble ikke utformet med tanke på AI-modelltrening.
OpenAI svarte nylig på søksmålet fra New York Times, som sannsynligvis er det mest profilerte av dem alle, og som hevder at NYT betalte noen til å "hacke" produktene deres.
OpenAI hevdet at NYT brukte komplekse instruksjoner for å tvinge frem tilfeller av brudd på opphavsretten.
NYT slo imidlertid tilbake og sa at fordi AI-selskaper ikke offentliggjør treningsdataene sine, har folk ikke noe annet valg enn å reverse engineer produktene for å avsløre dem.
Etter hvert som presset på generativ AI-selskaper øker, nærmer bransjen seg et veiskille.