Comment fonctionne le "droit à l'oubli" dans le contexte de l'IA ?

15 juillet 2023

Conformité au GDPR

Une nouvelle étude révèle la complexité du "droit à l'oubli" du GDPR dans le contexte de l'IA.

Également connu sous le nom de "droit à l'effacement", ce droit donne aux individus le pouvoir d'exiger des entreprises technologiques qu'elles suppriment définitivement leurs données personnelles. Cependant, dans le contexte des grands modèles de langage (LLM) et des chatbots d'IA, il n'existe pas de moyen simple d'inverser la formation du modèle pour supprimer des données spécifiques. 

Le droit à l'oubli ne se limite pas au GDPR européen. On trouve des législations comparables au Canada (CCPA), au Japon (APPI) et dans plusieurs autres pays. À l'origine, les procédures de droit à l'oubli étaient principalement conçues pour les moteurs de recherche, ce qui permettait à des entreprises comme Google et Microsoft de localiser et d'éliminer relativement facilement des données spécifiques de leurs index Web.

Des chercheurs de la Data61 Business Unit, une branche de la National Science Agency australienne spécialisée dans l'IA, la robotique et la cybersécurité, ont exploré la RTBF pour l'IA dans le cadre d'un projet de recherche. étude récente.

Ils ont cherché à déterminer si et comment la RTBF pouvait fonctionner dans une nouvelle ère de modèles d'IA formés sur de grandes quantités de données extraites de l'internet. Ces données contiennent des noms et probablement d'autres informations personnelles identifiables (PII). 

Dans certains cas, les IA peuvent fournir des informations incorrectes, voire diffamatoires, sur les personnes. Au cours des derniers mois, OpenAI a été mêlée à des affaires de corruption. affaires de diffamation multiplesLa Commission a également publié un rapport sur la fraude et l'agression sexuelle, ce qui n'est vrai dans aucun des deux cas. 

Dans toutes ces situations, la suppression des données à l'origine des allégations devrait être un minimum absolu. 

Toutefois, comme le soulignent les chercheurs, les algorithmes d'apprentissage automatique ne sont pas aussi simples que les moteurs de recherche.

Ils soulignent que les LLM stockent et traitent les informations "d'une manière complètement différente" par rapport à l'approche d'indexation utilisée par les moteurs de recherche.

Et comment savoir si vos données personnelles sont contenues dans le modèle ? Selon les chercheurs, les utilisateurs ne peuvent obtenir des informations sur leurs données personnelles dans les LLM "qu'en inspectant l'ensemble de données d'entraînement d'origine ou peut-être en demandant au modèle de le faire". C'est ainsi que Mark Walters, de Géorgie (États-Unis), a découvert que son nom était lié à une fraude dans certains résultats de ChatGPT. 

ChatGPT a déclaré à propos de Walters : "Mark Walters ('Walters') est une personne physique qui réside en Géorgie... Walters a manqué à ses devoirs et responsabilités en détournant, entre autres, les fonds et les actifs de la SAF à son profit, et en manipulant les registres financiers et les relevés bancaires de la SAF pour dissimuler ses activités".

Si les services d'IA posent des problèmes pour le droit à l'oubli, cela ne signifie pas qu'ils sont dispensés de respecter le droit à la vie privée. 

Les chercheurs proposent diverses stratégies pour éliminer les données des modèles d'apprentissage de l'IA, notamment la technique SISA de "désapprentissage de la machine", le désapprentissage inductif du graphe et la suppression approximative des données, entre autres. 

Ces méthodes pourraient permettre aux développeurs d'IA de sonder de manière fiable leurs ensembles de données et de supprimer des données spécifiques afin de respecter la RTBF.

Pouvez-vous retirer vos données des modèles d'IA comme ChatGPT ?

L'OpenAI a mis en place des procédures permettant aux individus de demander la suppression de leurs données personnelles dans les modèles d'IA et de refuser l'utilisation future de leurs données pour l'entraînement de l'IA. 

Cet article couvre divers aspects de la politique de confidentialité d'OpenAI, y compris le droit à l'effacement, qui peut être demandé par l'intermédiaire de ce formulaire. Le traitement spécifique de ces demandes reste nébuleux, et il y a peu de preuves que des personnes ont présenté avec succès des demandes auprès de la RTBF. 

En outre, les utilisateurs peuvent faire une demande d'accès aux données (DSAR) pour exercer les droits garantis par le GDPR, tels que la correction, la restriction ou le transfert des données. 

Cependant, OpenAI a fait remarquer que la correction des données inexactes générées par ses modèles est actuellement irréalisable, de sorte que la solution consisterait probablement à les supprimer.

Malgré ces mécanismes, l'OpenAI a prévenu qu'elle pourrait refuser de donner suite aux demandes ou n'y donner suite que partiellement, en raison de contraintes juridiques et de la nécessité de trouver un équilibre entre les demandes de protection de la vie privée et la liberté d'expression.

OpenAI propose également une option de retrait pour les utilisateurs qui ne souhaitent pas que leurs données soient utilisées pour l'entraînement à l'IA via les paramètres du compte ChatGPT.

L'OpenAI fournit l'adresse électronique suivante pour toute correspondance à ce sujet : [email protected].

Bien entendu, ChatGPT n'est pas la seule IA formée à partir de données Internet ouvertes. Toute personne souhaitant supprimer ses informations personnelles de tous les principaux chatbots IA publics doit contacter chaque développeur séparément.

En réalité, la plupart des données publiées sur l'internet sont à la portée des entreprises spécialisées dans l'IA, et il est extrêmement difficile de supprimer les données des modèles. 

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation