The Guardian sluit zich aan bij andere nieuwswebsites en blokkeert GPTBot

4 september 2023

The Guardian heeft zich aangesloten bij een groeiende lijst van websites die OpenAI's GPTBot hebben geblokkeerd voor het schrapen van hun websites.

Het Britse dagblad kondigde haar besluit aan op haar website afgelopen vrijdag en sluit zich aan bij CNN, Reuters, de Washington Post, Bloomberg en de New York Times in GPTBot blokkeren. Hoewel er geen volledige uitleg werd gegeven over de redenen achter de beslissing, werden wel enkele algemene zorgen van de industrie genoemd.

Het noemde de voortdurende rechtszaken over auteursrecht gebracht door auteurs als Sarah Silverman en de oproepen van Britse boekuitgevers om hun werk te beschermen tegen uitbuiting door AI.

The Guardian erkent dat generatieve AI-tools zoals ChatGPT een aantal indrukwekkende dingen doen, maar sommige semantiek in de aankondiging verraadt een minder enthousiaste kijk op hoe AI-bedrijven te werk gaan.

In de aankondiging werd opgemerkt dat ChatGPT werd getraind op enorme hoeveelheden gegevens die van het internet werden "geplukt" en dat de aankondiging in actie kwam om het bedrijf te beletten software te gebruiken die zijn gegevens "oogst".

Ze heeft niet meteen "Stop de dief!" geroepen, maar de boodschap is vrij duidelijk. 

Een woordvoerder van de uitgever van de Guardian en Observer zei: "Het schrapen van intellectueel eigendom van de website van de Guardian voor commerciële doeleinden is en was altijd al in strijd met onze servicevoorwaarden."

In een teken dat het mogelijk open staat voor het toestaan van dataschrapen in de toekomst, zei de woordvoerder: "Het commerciële licentieteam van The Guardian heeft veel wederzijds voordelige commerciële relaties met ontwikkelaars over de hele wereld en kijkt ernaar uit om dergelijke relaties in de toekomst verder uit te bouwen."

Interessant genoeg merkte The Guardian ook bezorgdheid op over het potentieel van generatieve AI voor het produceren van desinformatie. De Guardian legde niet uit hoe dit verband hield met de beslissing om GPTBot te blokkeren, maar als nieuwsuitgever is dit een voor de hand liggend punt van zorg.

Afgezien van ethische en auteursrechtelijke kwesties, kan het ook zijn dat de servers van de website van The Guardian soortgelijke problemen hebben ondervonden als die van X. 

Eerder dit jaar zei Elon Musk dat een aanzienlijk deel van de belasting van de X-servers afkomstig was van een veel AI-schraperbots. Hij heeft ze niet helemaal geblokkeerd en is ook van plan om openbare tweets te gebruiken om zijn xAI-model te trainen.

Als een AI-bot een website bezoekt en een robot.txt-bestand tegenkomt dat de website "blokkeert", dan zal hij de website niet scrapen uit beleefdheid, niet omdat hij het niet kan. 

Als de auteursrechtkwesties eenmaal wettelijk zijn geregeld, vraag ik me af hoe lang de hoffelijkheid de onverzadigbare honger van AI naar gegevens zal blijven overtroeven.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden