OpenAI og The Associated Press (AP) kunngjør et samarbeid om AI-trening

15. juli 2023

AP OpenAI

OpenAI har bekreftet en lisensavtale med Associated Press (AP) om å trene opp sine AI-modeller ved hjelp av nyhetsarkivet.

Avtalen går i hovedsak ut på at AP skal gi OpenAI tilgang til sine teksthistorier for AI-trening. Til gjengjeld vil OpenAI utvide sin teknologi til AP, slik at de kan integrere generativ AI i sine arbeidsflyter. 

OpenAI vil ha rett til å skrape data fra APs historiearkiv som strekker seg tilbake til 1985.

"Generativ AI er et område i rask utvikling med enorme konsekvenser for nyhetsbransjen. Vi er glade for at OpenAI anerkjenner at faktabasert, upartisk nyhetsinnhold er avgjørende for denne teknologien i utvikling, og at de respekterer verdien av våre immaterielle rettigheter." sier Kristin Heitmann, APs senior visepresident og inntektssjef.

Bruken av offentlige internettdata til å trene opp AI-systemer er i ferd med å bli et stridspunkt. Dette vil sannsynligvis øke populariteten til denne typen private og sponsede avtaler.

De store språkmodellene (LLM) som driver chatbotene hos OpenAI, Google osv., har blitt trent opp på en enorm mengde data som er samlet inn fra offentlig tilgjengelige internettkilder. 

Dette omfatter tredjepartsinnhold som nyhetsartikler, Wikipedia-oppføringer og kommentarer fra sosiale medier og blogger, som alle er hentet uten eksplisitt tillatelse fra eller kjennskap til opphavspersonene.

Dette er ikke uten juridiske og etiske utfordringer, ettersom det er usannsynlig at alle disse dataene samles inn på lovlig vis. I det minste forvrenger AI-treningsdata betydningen av "åpen" og "offentlig tilgjengelig". 

Andres Sawicki, professor i immaterialrett ved University of Miami, kommenterte: "Datasettene inneholder mye innhold som er opphavsrettslig beskyttet. Rettighetshaverne liker ikke denne utnyttelsen. Det er ikke vanskelig å se for seg at flere avtaler som den AP har inngått mellom teknologiselskaper og innholdsprodusenter i et forsøk på å bygge en "ren database". Problemet er at datasettene som trengs for å trene opp modellene, er så enorme at jeg tviler på at det vil være mulig å få tillatelse fra et tilstrekkelig antall rettighetshavere til å gjøre teknologien praktisk gjennomførbar."

Denne uken offentliggjorde den amerikanske Federal Trade Commission (FTC) innledet etterforskning FTC har undersøkt OpenAIs praksis rundt bruk av data i modellopplæring. FTC har krevd dokumentasjon fra OpenAI for å forstå strategiene deres og avdekke avvik. 

OpenAI og AP har uttrykt seg positivt om partnerskapet, og sier at de "tror på ansvarlig utvikling og bruk av disse AI-systemene". 

 

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Sam Jeans

Sam er en vitenskaps- og teknologiskribent som har jobbet i ulike oppstartsbedrifter innen kunstig intelligens. Når han ikke skriver, leser han medisinske tidsskrifter eller graver seg gjennom esker med vinylplater.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser