OpenAI et MidJourney cherchent à acheter les données de WordPress et de Tumblr

28 février 2024

AI tumblr wordpress

Automattic, l'entreprise à l'origine de WordPress et de Tumblr, discute d'un accord sur les données et le contenu avec MidJourney et OpenAI.

Ces informations, initialement couvertes par 404 Médias et d'après les rapports d'une source anonyme au sein d'Automattic, un accord avec OpenAI et MidJourney pourrait être imminent.  

Cela fait suite à des rumeurs circulant sur Tumblr au sujet d'un accord potentiel avec MidJourney qui pourrait introduire une nouvelle source de revenus pour la plateforme.

404 indique que le processus d'accord a été désordonné jusqu'à présent, y compris un transfert de données partiellement raté à OpenAI et MidJourney qui contenait, selon les termes de l'un des chefs de produit de Tumblr :

Les messages privés sur les blogs publics, les messages sur les blogs supprimés ou suspendus, les questions sans réponse (normalement, elles ne sont pas publiques tant qu'elles n'ont pas reçu de réponse), les réponses privées (elles n'apparaissent qu'au destinataire et ne sont pas publiques), les messages marqués comme "explicites" / NSFW / "matures" selon nos normes plus modernes (ce n'est peut-être pas grave, je n'en sais rien)."

Les implications de cette décision restent floues et de plus amples détails sur l'accord sont à venir.

La ruée vers les données d'entraînement à l'IA monte d'un cran

Et c'est ainsi que la ruée vers les données de formation à l'IA est passée à la vitesse supérieure. 

Oui, les entreprises d'IA générative ont toujours eu besoin de grandes quantités de données, mais elles s'empressent désormais de les payer plutôt que de les récupérer gratuitement. 

Il y a quelques jours, Reddit aurait discuté Reddit concède sa vaste gamme de contenus générés par les utilisateurs à une société d'intelligence artificielle dont le nom n'a pas encore été révélé, dans le cadre d'un accord qui pourrait rapporter environ $60 millions par an. Cette annonce intervient alors que Reddit se prépare à faire une offre publique de vente en mars, en visant une valorisation proche de $5 milliards.

Cet accord de licence potentiel s'inscrit dans le cadre d'une tendance croissante des entreprises technologiques à conclure des accords légitimes d'utilisation des données, en particulier face aux risques croissants en matière de droits d'auteur.

Les batailles juridiques en cours, telles que la Procès du New York Timesont augmenté l'urgence du contenu. des affaires. 

La décision d'Automattic de négocier avec des entreprises spécialisées dans l'IA soulève des questions sur l'utilisation de contenus générés par les utilisateurs pour l'entraînement à l'IA.

Ils auraient annoncé leur intention d'introduire une nouvelle fonctionnalité permettant aux utilisateurs de refuser que leurs données soient partagées avec des tiers, y compris des entreprises d'intelligence artificielle. 

Automattic a fait un déclaration publique publié à la suite du rapport de 404, déclarant : "Nous bloquons actuellement, par défaut, les principaux robots d'indexation des plateformes d'IA - y compris ceux des plus grandes entreprises technologiques - et nous mettons à jour nos listes au fur et à mesure que de nouveaux robots sont lancés", et "nous ne partagerons que le contenu public hébergé sur WordPress.com et Tumblr des sites qui n'ont pas choisi de s'exclure". 

Nous travaillons également directement avec certaines entreprises spécialisées dans l'IA, pour autant que leurs plans soient conformes aux préoccupations de notre communauté : attribution, exclusion et contrôle.

Cependant, le fait de refuser que vos informations soient utilisées pour l'entraînement à l'IA pourrait pénaliser les comptes des utilisateurs.

Une nouvelle FAQ intitulée "Que se passe-t-il lorsque vous vous désengagez ?" indique : "Si vous vous désengagez dès le départ, nous empêcherons les robots d'accéder à votre contenu en ajoutant votre site à une liste d'exclusion. Si vous changez d'avis plus tard, nous prévoyons également de mettre à jour tous les partenaires au sujet des personnes qui se sont récemment désinscrites et de demander que leur contenu soit supprimé des sources passées et des formations futures".

Nous vivons aujourd'hui dans un monde où tout ce que vous avez publié sur l'internet peut être vendu à des fins d'entraînement à l'IA - si ce n'est pas gratuit.

Et à mesure que l'IA évolue, le débat sur l'utilisation des données et la protection de la vie privée va probablement s'intensifier.

Les entreprises qui possèdent des mines d'or de données sont en passe de gagner gros, mais à quel prix pour l'utilisateur moyen de l'internet ?

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation