Le Guardian rejoint d'autres sites d'information pour bloquer GPTBot

4 septembre 2023

Le Guardian a rejoint une liste croissante de sites web qui ont empêché le GPTBot d'OpenAI d'accéder à leurs sites web.

Le quotidien britannique a annoncé sa décision sur son site web vendredi dernier et rejoint CNN, Reuters, le Washington Post, Bloomberg et le New York Times dans la liste des sites web de l bloquer GPTBot. Bien qu'elle n'ait pas expliqué en détail les raisons de cette décision, elle a mentionné certaines préoccupations courantes du secteur.

Elle a cité l'affaire en cours litiges en matière de droits d'auteur Les auteurs comme Sarah Silverman et les éditeurs de livres britanniques ont demandé à ce que leurs œuvres ne soient pas exploitées par l'IA.

Le Guardian reconnaît que les outils d'IA générative comme ChatGPT font des choses impressionnantes, mais certains éléments sémantiques de l'annonce révèlent une vision moins enthousiaste de la manière dont les entreprises d'IA mènent leurs activités.

Le communiqué indique que ChatGPT a été formé sur la base de vastes quantités de données extraites de l'internet et qu'il a agi pour empêcher l'entreprise d'utiliser des logiciels qui "récoltent" ses données.

Elle n'a pas crié d'emblée "Stop au voleur !", mais le message est assez clair. 

Un porte-parole de l'éditeur du Guardian et de l'Observer a déclaré : "La récupération de la propriété intellectuelle du site web du Guardian à des fins commerciales est, et a toujours été, contraire à nos conditions d'utilisation".

Le porte-parole a déclaré : "L'équipe chargée des licences commerciales du Guardian entretient de nombreuses relations commerciales mutuellement bénéfiques avec des développeurs du monde entier et se réjouit à l'idée de nouer d'autres relations de ce type à l'avenir".

Il est intéressant de noter que The Guardian a également fait part de ses préoccupations quant au potentiel de l'IA générative à produire de la désinformation. Il n'a pas expliqué en quoi cette préoccupation était liée à sa décision de bloquer GPTBot, mais en tant qu'éditeur de presse, il s'agit d'un sujet de préoccupation évident.

Au-delà des questions d'éthique et de droits d'auteur, il est possible que les serveurs du site web du Guardian aient connu des problèmes similaires à ceux de X. 

Au début de l'année, Elon Musk a déclaré qu'une grande partie de la charge que subissaient les serveurs X provenait d'une une multitude de robots racleurs d'IA. Il ne les a pas bloqués d'emblée et a l'intention d'utiliser les tweets publics pour entraîner son modèle d'IAO.

Lorsqu'un robot d'intelligence artificielle visite un site web et se heurte à un fichier robot.txt qui le "bloque", il n'explore pas le site web par courtoisie, et non parce qu'il en est incapable. 

Une fois les questions de droit d'auteur réglées, je me demande combien de temps la courtoisie continuera à l'emporter sur l'appétit insatiable de l'IA pour les données.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Eugène van der Watt

Eugene a une formation d'ingénieur en électronique et adore tout ce qui touche à la technologie. Lorsqu'il fait une pause dans sa consommation d'informations sur l'IA, vous le trouverez à la table de snooker.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation