Meta a utilisé des posts de Facebook et d'Instagram pour entraîner ses modèles d'IA.

1er octobre 2023

Meta ai

Auriez-vous autorisé Meta à utiliser vos posts Facebook et Instagram pour entraîner ses modèles d'IA ? En réalité, vous n'avez pas eu le choix. 

Meta a confirmé son utilisation des données de Facebook et d'Instagram pour entraîner son nouvel assistant d'IA.

En août dernier, un porte-parole a déclaré que Llama 2 n'avait pas été entraîné sur les données de Meta, précisant que le modèle "n'a pas été entraîné sur les données des utilisateurs de Meta et que nous n'avons pas encore lancé de fonctions d'IA générative sur nos systèmes".

Cette position a changé avec la nouvelle stratégie multiplateforme de l'entreprise. assistant génératif d'IAqui utilise les données de Meta provenant des messages et commentaires publics. Cependant, Meta a déclaré avoir consciemment évité d'utiliser les messages privés partagés par la famille et les amis. 

Nick Clegg, président des affaires internationales de Meta, a déclaré lors de la conférence annuelle Connect de l'entreprise : "Nous avons essayé d'exclure les ensembles de données comportant une forte prépondérance d'informations personnelles". Il a ajouté que la "grande majorité" des données utilisées par Meta pour la formation étaient accessibles au public. 

Mme Clegg a donné un exemple en citant LinkedIn comme une plateforme dont Meta a délibérément décidé de ne pas utiliser le contenu pour des raisons de protection de la vie privée.

Des géants de la technologie comme Meta, OpenAI et Google ont récemment été critiqués pour avoir utilisé des données internet sans leur consentement afin d'entraîner leurs modèles d'intelligence artificielle. 

Ces entreprises sont aujourd'hui confrontées à des décisions concernant l'utilisation de contenus privés ou protégés par le droit d'auteur dans leurs systèmes d'intelligence artificielle et doivent faire face à des poursuites judiciaires de la part d'auteurs qui les accusent d'avoir violé le droit d'auteur. Plusieurs auteurs de renom, dont le créateur de Game of Thrones, George R.R Martin, ont récemment s'est jointe à un déluge de poursuites judiciaires contre OpenAI et Meta. 

Lors de l'événement Connect de Meta, le PDG Mark Zuckerberg a dévoilé Meta AI. Cet outil a été présenté comme l'une des principales offres de l'entreprise en matière d'IA axée sur le consommateur. Contrairement aux événements précédents, l'accent a été mis cette année sur l'IA, en s'éloignant du projet de réalité augmentée et virtuelle du métavers, largement défunt. 

Le fondement de l'assistant IA de Meta repose sur un modèle personnalisé inspiré du modèle linguistique Llama 2, dont l'utilisation publique et commerciale a été lancée en juillet. En outre, ils ont développé Emu, un modèle innovant conçu pour créer des visuels à partir d'entrées textuelles.

Clegg a souligné que ce processus d'entraînement à l'IA utilisait du texte et des images provenant de publications publiques sur Facebook et Instagram.

Un représentant de Meta a déclaré que le modèle Emu avait été spécialement formé à la génération d'images à partir de ces messages publics.

Les fonctionnalités de chat, quant à elles, étaient basées sur le modèle Llama 2, qui a été complété par des ensembles de données annotées et accessibles au public.

Du point de vue de la sécurité, M. Clegg a indiqué que des mesures spécifiques avaient été mises en place, comme l'interdiction pour l'outil d'IA de générer des images hyperréalistes de personnalités publiques. Abordant le sujet controversé du contenu protégé par des droits d'auteur, M. Clegg a déclaré : "Nous pensons que c'est le cas, mais je soupçonne fortement que cela se traduira par des litiges."

Interrogé sur les précautions prises par Meta contre la reproduction d'images protégées par le droit d'auteur, un représentant de l'entreprise a indiqué que les conditions d'utilisation mises à jour interdisaient strictement aux utilisateurs de créer des contenus qui enfreignent les normes en matière de confidentialité et de propriété intellectuelle.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation