L'outil d'empoisonnement des données de l'université de Chicago, Nightshade, a été téléchargé plus de 250 000 fois dans les cinq jours qui ont suivi son lancement, le 18 janvier 2024.
Conçu pour permettre aux artistes visuels de lutter contre l'utilisation non autorisée de leurs œuvres par des modèles d'IA, Nightshade propose une nouvelle approche en "empoisonnant" les modèles, perturbant ainsi leur capacité à apprendre à partir des images sur lesquelles ils ont été formés.
Ce processus fonctionne en modifiant subtilement les images au niveau du pixelCe qui les rend différents des modèles d'IA sans compromettre leur intégrité visuelle pour l'œil humain.
Lorsqu'un modèle d'IA est entraîné sur des images empoisonnées, ses résultats sont faussés, ce qui protège efficacement les artistes contre le grattage de données à long terme.
Les développeurs d'IA voudront éviter d'endommager leurs modèles en s'entraînant sur des images empoisonnées, ce qui met la balle dans leur camp.
Ils mettront au point une solution ou modifieront leurs pratiques de récupération de données afin d'éviter les œuvres protégées par le droit d'auteur susceptibles d'être empoisonnées.
Le Nightshade fonctionne mieux lorsqu'il est utilisé à grande échelle - plus il y a d'images empoisonnées qui se retrouvent dans un modèle d'IA, plus l'impact est fort.
Si, en théorie, chaque image d'un ensemble de données était empoisonnée, le modèle d'IA aurait du mal à générer quoi que ce soit de cohérent - ses résultats seraient un véritable désordre.
À plus petite échelle, les images empoisonnées manipulent le modèle pour qu'il apprenne de fausses associations, ce qui signifie qu'une image d'un "chat sur un nuage" peut produire quelque chose qui ressemble à "un sac à main dans un champ".
Bien que les entreprises spécialisées dans l'IA disposent déjà de grandes quantités de données, si elles ne parviennent pas à constituer de nouveaux ensembles de données contemporains, les modèles finiront par perdre le contact avec la réalité.
Ben Zhao, chef de projet et professeur d'informatique à l'université, s'est étonné de l'accueil réservé à l'outil. VentureBeatJe l'avais encore sous-estimé. La réponse est tout simplement au-delà de ce que nous avions imaginé."
L'équipe a fait écho à ces propos dans une déclaration sur les médias sociaux, soulignant la demande sans précédent : "La demande pour Nightshade a dépassé toutes les bornes", ont-ils déclaré, notant que le flot de téléchargements mondiaux avait momentanément submergé l'infrastructure du réseau de l'université, ce qu'ils ont d'abord pensé être une cyber-attaque.
La demande de morelles a explosé. Les demandes globales ont en fait saturé la liaison réseau de notre campus. (Pas d'attaque de dos, juste des téléchargements légitimes). Nous ajoutons deux liens miroirs rapides pour les binaires nightshade.
Gagnez : https://t.co/rodLkW0ivK
Mac : https://t.co/mEzciopGAE- Glaze à l'Université de Chicago (@TheGlazeProject) 20 janvier 2024
Cet outil est le dernier d'une série d'efforts déployés par l'équipe, après Glaze, un autre outil destiné à tromper les modèles d'IA sur le style d'une œuvre d'art. Les développeurs étudient actuellement les moyens d'intégrer Nightshade et Glaze, afin d'offrir une défense à plusieurs niveaux pour les contenus numériques.
Nightshade est assez complexe et exigeant en termes de ressources, et nécessite un gros ordinateur pour fonctionner.
L'empoisonnement de plusieurs images prend également du temps, mais une fois que c'est fait, c'est fait. L'interface utilisateur de Nightshade, même si elle n'est pas particulièrement attrayante, est assez intuitive, guidant les utilisateurs tout au long du processus avec des paramètres simples et un rendu dans un délai de 30 à 180 minutes, en fonction des paramètres choisis.
Artistes et passionnés de technologie utilisent l'outil, et certains préconisent l'utilisation généralisée de Nightshade sur tous les contenus numériques personnels afin de diluer le réservoir de données pour les modèles d'IA. L'union fait la force, comme on dit.
Les riposte des artistes contre les développeurs d'IA utilisant des données sur le droit d'auteur a été immense cette année, avec des artistes de tous les horizons créatifs se ralliant à X et à d'autres plateformes de médias sociaux, répondant à l'appel de défenseurs tels que Reid Southen et Jon Lam.
250K téléchargements pour Nightshade ! Shade/Glaze et téléchargeons. Le téléchargement n'est que la première étape ! Félicitations à @TheGlazeProject
télécharger ici ! Commencez à empoisonner votre art MAINTENANT !https://t.co/Y45iGlF6cyhttps://t.co/uiGfBVwFRu
- Jon Lam #CreateDontScrape (@JonLamArt) 30 janvier 2024
Les développeurs d'IA n'ont pas seulement à se préoccuper des artistes, ils doivent également lutter contre une série de problèmes liés à l'utilisation des technologies de l'information. litiges en matière de droits d'auteur et lutter contre l'augmentation de la demande d'énergie et les pénuries imminentes de semi-conducteurs.
Bien que Nightshade présente encore une certaine complexité d'utilisation, il est prévu de l'intégrer à l'application sociale et de portefeuille Cara, actuellement en version bêta ouverte, ce qui laisse présager une adoption plus large.
À terme, Nightshade pourrait être entièrement hébergé dans le nuage, ce qui le rendrait très accessible.
Alors que le paysage numérique continue d'évoluer, des outils comme Nightshade représentent une solution technique et un symbole de la lutte permanente pour le contrôle et le respect à l'ère de l'IA.
Il s'agit d'une nouvelle "course à l'IA" dans un secteur actuellement sous tension.