OpenAI og The Associated Press (AP) annoncerer samarbejde om AI-træning

15. juli 2023

AP OpenAI

OpenAI har bekræftet en licensaftale med The Associated Press (AP) om at træne sine AI-modeller ved hjælp af deres nyhedsarkiv.

Kernen i aftalen er, at AP vil give OpenAI adgang til sin store mængde teksthistorier til AI-træning. Til gengæld vil OpenAI udvide sin teknologi til AP, så de kan integrere generativ AI i deres arbejdsgange. 

OpenAI får ret til at scrape data fra AP's historiearkiv, der strækker sig tilbage til 1985.

"Generativ AI er et område i rivende udvikling med enorme konsekvenser for nyhedsindustrien. Vi er glade for, at OpenAI anerkender, at faktabaseret, upartisk nyhedsindhold er afgørende for denne udviklende teknologi, og at de respekterer værdien af vores intellektuelle ejendom". sagde Kristin HeitmannAP senior vice president og chief revenue officer.

Praksis med at bruge offentlige internetdata til at træne AI-systemer er ved at blive et stridspunkt. Det vil sandsynligvis øge populariteten af denne type private og sponsorerede aftaler.

De store sprogmodeller (LLM'er), der driver chatbots hos OpenAI, Google osv., er blevet trænet på en kolossal mængde data indsamlet fra offentligt tilgængelige internetkilder. 

Dette omfatter tredjepartsindhold som nyhedsartikler, Wikipedia-indlæg og kommentarer fra sociale medier og blogs, som alle er taget uden udtrykkelig tilladelse eller kendskab til forfatterne.

Det er ikke uden juridiske og etiske udfordringer, da det er usandsynligt, at alle disse data indsamles lovligt. I det mindste fordrejer AI-træningsdata betydningen af 'åben' og 'offentligt tilgængelig'. 

Andres Sawicki, professor i intellektuel ejendomsret ved University of Miami, siger: "Datasættene indeholder en masse indhold, som er ophavsretligt beskyttet. Indehaverne af ophavsretten godkender ikke denne udnyttelse. Det er ikke svært at forestille sig, at der bliver indgået flere aftaler som den med AP mellem teknologivirksomheder og indholdsproducenter i et forsøg på at opbygge en "ren database". Problemet er, at de datasæt, der er nødvendige for at træne modellerne, er så massive, at jeg tvivler på, at det vil være muligt at sikre tilladelse fra et tilstrækkeligt antal ejere til at gøre teknologien praktisk anvendelig."

I denne uge har den amerikanske Federal Trade Commission (FTC) iværksat undersøgelser i OpenAI's praksis omkring brugen af data i modeltræning. FTC har krævet dokumentation fra OpenAI for at forstå deres strategier og identificere manglende overholdelse. 

OpenAI og AP har udtrykt sig positivt om partnerskabet og udtalt, at de "tror på ansvarlig skabelse og brug af disse AI-systemer". 

 

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Sam Jeans

Sam er videnskabs- og teknologiforfatter og har arbejdet i forskellige AI-startups. Når han ikke skriver, kan han finde på at læse medicinske tidsskrifter eller grave i kasser med vinylplader.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser