OpenAI en The Associated Press (AP) kondigen samenwerking aan op het gebied van AI-training

15 juli 2023

AP OpenAI

OpenAI heeft een licentieovereenkomst gesloten met The Associated Press (AP) om zijn AI-modellen te trainen met behulp van het nieuwsarchief.

De essentie van de overeenkomst is dat AP OpenAI toegang zal geven tot zijn schat aan tekstverhalen voor AI-training. In ruil daarvoor zal OpenAI zijn technologie uitbreiden naar AP, zodat zij generatieve AI kunnen integreren in hun workflows. 

OpenAI krijgt het recht om gegevens te scrapen uit het verhalenarchief van AP dat teruggaat tot 1985.

"Generatieve AI is een snel evoluerend domein met enorme implicaties voor de nieuwsindustrie. We zijn blij dat OpenAI erkent dat op feiten gebaseerde, onpartijdige nieuwscontent essentieel is voor deze zich ontwikkelende technologie, en dat ze de waarde van ons intellectueel eigendom respecteren." zei Kristin HeitmannAP, senior vice president en chief revenue officer.

De praktijk van het gebruik van openbare internetgegevens om AI-systemen te trainen wordt een twistpunt. Dit zal de populariteit van dit soort private en gesponsorde deals waarschijnlijk doen toenemen.

De grote taalmodellen (LLM's) die chatbots van OpenAI, Google, enz. aandrijven, zijn getraind op een kolossale hoeveelheid gegevens die zijn verzameld uit openbaar toegankelijke internetbronnen. 

Dit omvat inhoud van derden, zoals nieuwsartikelen, Wikipedia-items en commentaren van sociale media en blogs, die allemaal zijn genomen zonder uitdrukkelijke toestemming of medeweten van de auteurs.

Dit is niet zonder juridische en ethische uitdagingen, want het is onwaarschijnlijk dat al deze gegevens legaal worden verzameld. AI-trainingsgegevens verdraaien in ieder geval de betekenis van 'open' en 'publiek toegankelijk'. 

Andres Sawicki, een professor in intellectueel eigendomsrecht aan de Universiteit van Miami, zei: "De datasets bevatten veel inhoud waar auteursrecht op rust. De houders van de auteursrechten keuren deze exploitatie niet goed. Het is niet moeilijk voor te stellen dat er meer deals zoals die van AP worden gesloten tussen techbedrijven en producenten van inhoud in een poging om een "schone database" op te bouwen. Het probleem is dat de datasets die nodig zijn om de modellen te trainen zo enorm zijn dat ik betwijfel of het mogelijk zal zijn om toestemming te krijgen van voldoende eigenaren om de technologie praktisch te maken."

Deze week heeft de Amerikaanse Federal Trade Commission (FTC) onderzoeken gestart naar de praktijken van OpenAI rond het gebruik van data in modeltraining. De FTC heeft documentatie van OpenAI geëist om zijn strategieën te begrijpen en om niet-naleving vast te stellen. 

OpenAI en AP hebben zich positief uitgelaten over de samenwerking en verklaard dat ze "geloven in de verantwoordelijke creatie en het gebruik van deze AI-systemen". 

 

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden