Au cœur de la bataille entre les artistes et les générateurs d'images à base d'IA

5 août 2023

Droit de l'IA

Les artistes et les créateurs s'en prennent aux développeurs d'IA pour violation potentielle des droits d'auteur.

Tapez un message dans un générateur d'images d'IA tel que DALL-E, MidJourney ou Stable Diffusion, et il produira une image apparemment unique en l'espace de quelques secondes.

Malgré leur apparente singularité, les tCes images sont générées à partir de milliards d'autres images par le biais de ce que l'on peut décrire comme une technique complexe de collage numérique.

Les images sources sont extraites de sources "publiques" ou "ouvertes". 

Si vous demandez à ChatGPT comment fonctionne un générateur d'images comme DALL-E, il vous répondra quelque chose comme : "Considérez DALL-E comme un artiste numérique super avancé, qui a vu des millions d'images et peut en dessiner une nouvelle sur la base de votre description, en essayant de la rendre aussi précise que possible. Pour ce faire, il mélange et associe les éléments qu'il a appris lors de ses précédentes "observations".

C'est un peu comme si vous parcouriez les galeries d'art du monde entier et preniez des photos de chaque œuvre - sauf que vous ne pouvez pas être mis à la porte. 

L'internet n'est pas surveillé par des gardes de sécurité et des caméras pour empêcher le piratage ou le vol, et la pratique du "data scraping" - qui consiste à collecter des données sur l'internet à l'aide de robots - a toujours occupé un territoire juridique nébuleux. 

Les artistes affirment que la formation d'IA de conversion de texte en image sur des ensembles de données publiques équivaut au plus grand vol d'œuvres d'art au monde.

Que ressentent les artistes face aux détecteurs d'IA ?

Pour certains artistes à succès dont les œuvres ont été copiées des milliers, voire des millions de fois, l'impact de l'art généré par l'IA a rendu difficile la distinction entre leurs propres œuvres et les copies de l'IA.

Les différences esthétiques sont tout simplement trop faibles, probablement parce que les images populaires apparaissent fréquemment dans les ensembles de données. 

Parmi eux, Greg Rutowski, qui a déclaré : "Mon travail a été utilisé dans l'IA plus que Picasso". 

Greg Rutowski
Le travail de Greg Rutowski a été copié des milliers de fois : Source : MIT.

Les illustrations fantastiques de Rutowki figurent dans des franchises telles que Donjons et Dragons et Magic : The Gathering et peuvent être reproduites par des générateurs texte-image en ajoutant simplement le nom de l'artiste à l'invite, par exemple : "Créez un dragon affrontant un ogre dans le style de Greg Rutowski". 

Il a déclaré à la BBCLe premier mois où je l'ai découvert, j'ai réalisé que cela affecterait clairement ma carrière et que je ne serais pas en mesure de reconnaître et de trouver mes propres œuvres sur l'internet", ajoutant : "Les résultats seront associés à mon nom, mais il ne s'agira pas de mon image. Ce ne sera pas moi qui l'aurai créée. Cela ajoutera donc de la confusion pour les personnes qui découvrent mes œuvres".

Et de poursuivre : "Tout ce sur quoi nous avons travaillé pendant tant d'années nous a été enlevé si facilement grâce à l'IA." 

La dernière affirmation fait mouche, car la reproduction par l'IA d'œuvres complexes et talentueuses ne prend que quelques secondes, ce qui signifie que non seulement les œuvres des artistes deviennent redondantes, mais aussi que les compétences utilisées pour les créer se perdent.

La vie de l'humanitée manque de compétences et de connaissances authentiques est l'un des risques les plus pressants de l'IA, baptisé "l'absence de compétences et de connaissances authentiques".l'affaiblissement,"Le film de Disney WALL-E, où les humains perdent la capacité de se déplacer à cause de la technologie, illustre bien ce phénomène. 

Kelly McKernan, illustratrice basée dans le Tennessee, s'est également exprimée sur la reproduction de ses œuvres par l'IA. Elle a découvert que plus de 50 de ses œuvres avaient été répertoriées comme données d'entraînement sur le réseau ouvert d'intelligence artificielle à grande échelle (Large-scale Artificial Intelligence Open Network - LAION).

Vous pouvez rechercher quelque 5,8 milliards d'images trouvées dans les ensembles d'entraînement de l'IA avec l'outil "Ai-je été formé ?"C'est ainsi que McKernan a découvert son travail. 

Ai-je été formé ? offre la possibilité d'effectuer des recherches dans des bases de données d'images à source ouverte.

LAION est une organisation à but non lucratif qui crée des modèles et des ensembles de données en libre accès, dont beaucoup ont été utilisés pour former des modèles de conversion texte-image de premier plan, notamment Stable Diffusion et Imagen.

"Soudain, toutes ces peintures avec lesquelles j'avais une relation personnelle et un parcours ont pris une nouvelle signification, cela a changé ma relation avec ces œuvres d'art", a déclaré M. McKernan.

Des batailles juridiques sont en cours 

Mme McKernan, rejointe par ses collègues artistes Sarah Anderson et Karla Ortiz, a intenté une action en justice contre Stability AI, DeviantArt et Midjourney.

Leur action en justice s'ajoute à une marée d'actions en justice contre les sociétés d'IA de la part d'écrivains et d'artistes visuels. 

De plus grandes entreprises poursuivent ou prévoient de poursuivre les développeurs d'IA, notamment Getty Images, qui a affirmé que Stability AI avait illégalement copié et traité 12 millions de ses images sans autorisation.

M. McKernan a déclaré : "Dans l'état actuel des choses, le droit d'auteur ne peut s'appliquer qu'à l'intégralité de mon image. J'espère qu'il [le procès] encouragera la protection des artistes afin que l'IA ne puisse pas être utilisée pour nous remplacer. Si nous gagnons, j'espère que beaucoup d'artistes seront payés. Il s'agit d'une main-d'œuvre gratuite et certaines personnes profitent de son exploitation.

Le style de McKernan, que l'on peut voir ci-dessous, a été demandé dans quelque 12 000 messages de MidJourney. 

 

Voir ce message sur Instagram

 

Un post partagé par Kelly McKernan (@kelly_mckernan)

Le problème fondamental est que la législation sur le droit d'auteur n'a tout simplement pas été conçue pour l'ère de l'IA.

Liam Budd, du syndicat des arts du spectacle Equity, a plaidé en faveur d'une mise à jour des lois reflétant les opportunités commerciales potentielles offertes par l'IA générative. 

Il déclaréeNous avons besoin d'une législation plus claire et nous faisons campagne pour que la loi sur les droits d'auteur soit mise à jour.

En réponse à la vague croissante de violations de droits d'auteur par l'IA, plusieurs juridictions, comme l'UE, ont proposé que les développeurs d'IA divulguent tout matériel protégé par le droit d'auteur utilisé pour l'entraînement. 

Cela suffira-t-il ? Les développeurs d'IA ont-ils déjà montré qu'ils s'en sortiraient probablement ?

Après tout, la plupart de ces ensembles de données sont déjà assemblés, et les entreprises spécialisées dans l'IA pourraient faire valoir qu'elles ne font que mettre à jour des modèles pour contourner la nécessité de déclarer des documents protégés par le droit d'auteur.

Les poursuites ont-elles une base juridique solide ?

Cette série de recours collectifs s'articule principalement autour de deux arguments. 

  • Tout d'abord, l'affirmation selon laquelle les entreprises ont violé les droits d'auteur des artistes en utilisant leurs œuvres sans autorisation. 
  • Deuxièmement, l'allégation selon laquelle les résultats de l'IA sont essentiellement des contenus dérivés en raison de leur inclusion dans les données d'entraînement. 

L'application de ces arguments diffère d'un pays à l'autre, comme aux États-Unis, où les lois sur l'utilisation équitable sont généralement plus libérales que dans l'UE. Cela complique encore le paysage du droit d'auteur en matière d'IA. Si les entreprises opèrent au Royaume-Uni, par exemple, il leur sera peut-être plus difficile d'invoquer le "fair use".

En outre, ce sont les entreprises d'IA générative qui sont poursuivies, et non les entités qui compilent les ensembles de données, comme LAION dans le cas de MidJourney. Eliana Torres, avocate spécialisée en propriété intellectuelle au cabinet Nixon Peabody, souligne que si LAION a créé l'ensemble de données, l'infraction alléguée a eu lieu à ce moment-là, et non lorsque l'ensemble de données a été utilisé pour former les modèles.

Ensuite, il est difficile de prouver que les œuvres générées par l'IA sont des reproductions d'œuvres originales en raison de la nature complexe de l'IA, qui utilise un traitement algorithmique pour décomposer et réassembler les images.

Les organismes de réglementation ont été pris au dépourvu par les implications juridiques de l'IA générative, et bien que des solutions provisoires telles que des filtres automatisés et des dispositions d'exclusion pour les artistes soient en cours d'élaboration, elles risquent de ne pas être suffisantes. 

Jusqu'à ce que les juges rendent des verdicts sur des cas individuels, ce qui pourrait prendre des mois, les entreprises d'IA générative s'exposent à des risques juridiques importants dans de nombreuses juridictions. 

L'histoire montre que la législation sur le droit d'auteur peut s'adapter aux nouvelles technologies, mais tant qu'un consensus ne se dégage pas, les artistes et les développeurs d'IA sont dans l'incertitude. 

Les juges freinent les poursuites judiciaires

Jusqu'à présent, les juges n'ont pas donné aux artistes beaucoup de raisons d'être optimistes. 

Par exemple, le juge du district américain William Orrick a jeté le doute sur le procès de Kelly McKernan.

Selon le juge OrrickSelon la Commission, M. McKernan et les autres plaignants devaient "fournir davantage de faits" concernant la violation présumée des droits d'auteur et différencier clairement leurs demandes à l'encontre de chaque société (Stability AI, DeviantArt et Midjourney). 

Orrick a fait remarquer que les systèmes avaient été entraînés sur "cinq milliards d'images compressées", de sorte que les artistes doivent fournir des preuves plus solides que leurs œuvres sont spécifiquement impliquées dans l'infraction présumée au droit d'auteur. A site web qui suit cette action en justice a récemment mis en ligne des informations techniques sur la manière dont ces modèles fonctionnent en interpolant le contenu des images dans leur ensemble d'apprentissage. 

L'affaire est représentée par le Joseph Saveri cabinet d'avocatsqui représente également au moins cinq autres affaires similaires contre des entreprises d'IA.

Là encore, le droit d'auteur est potentiellement violé lors de la collecte des données plutôt que lors de leur production. 

La section 1202(b) de la loi américaine sur le droit d'auteur (Digital Millennium Copyright Act) "concerne les "copies" identiques d'une œuvre - et non les bribes et adaptations éparses" - l'argument selon lequel les œuvres sont "copiées" par le processus du modèle d'IA est potentiellement peu convaincant. 

Le point de vue d'Orrick soulève également des questions sur la responsabilité d'entreprises telles que MidJourney et DeviantArt, qui intègrent la technologie de diffusion stable de Stability AI dans leurs propres systèmes d'IA générative. 

ISi les développeurs d'IA, tels que OpenAI, Meta, etc., se voient attribuer une certaine responsabilité pour avoir enfreint les droits d'auteur des artistes, ils s'exposent à d'autres actions en justice. 

Les auteurs et les écrivains lancent également des litiges 

Dans une autre procès récentLa comédienne et auteure américaine Sarah Silverman et les auteurs Christopher Golden et Richard Kadrey allèguent que leurs propos ont été illégalement utilisés pour entraîner des modèles d'intelligence artificielle tels que ChatGPT et LLaMA.

L'action en justice est parallèle à celle intentée par les artistes visuels, mais cette fois-ci, les IA sont formées à partir de données textuelles publiques. 

Le procès allègue que ChatGPT a été en mesure de résumer avec précision des livres tels que "The Bedwetter" de Silverman, "Ararat" de Golden et "Sandman Slim" de Kadrey. Le niveau de détail fourni par les résumés ne peut être expliqué par des extraits des livres téléchargés sur Wikipédia ou sur des sites de librairies. 

Les plaignants accusent OpenAI et Meta d'utiliser des livres protégés par le droit d'auteur provenant de "bibliothèques fantômes" sans leur consentement. 

Les bibliothèques fantômes, telles que Bibliotik, Library Genesis et Z-Library, hébergent de grandes quantités d'informations copiées illégalement. 

Bibliothèque
Library Genesis avait déjà fait l'objet d'une action en justice et s'était vu demander de fermer son site web, mais les organisateurs ont simplement ouvert de nouveaux domaines. Source : Wikipedia (en anglais).

S'il est évident que les entreprises d'IA ont monétisé des produits à l'aide d'œuvres protégées par le droit d'auteur, elles bénéficient de plusieurs niveaux de protection, notamment en raison de la nature intrinsèquement complexe de leurs modèles et de l'espace idiosyncratique qu'elles occupent dans le paysage moral, éthique et juridique.

Que doivent décider les tribunaux ? 

Tandis que les régulateurs délibèrent encore sur les règles relatives à l'IA, les juges pourraient être les premiers à façonner le futur paysage du droit d'auteur.

Cela pourrait Il en résulte un patchwork de législations limitées par les spécificités de chaque affaire et la juridiction dans laquelle elle a été jugée.

À l'heure actuelle, de nombreuses questions restent sans réponse : 

Q1 : La formation d'un modèle sur du matériel protégé par des droits d'auteur nécessite-t-elle une licence ?

  • Utilisation équitable ou licence: Les tribunaux pourraient être amenés à décider si la copie temporaire de données pendant la formation relève de l'"usage loyal", qui autoriserait l'utilisation sans licence. Cela pourrait dépendre de facteurs tels que le but de la copie, la nature de l'œuvre protégée par le droit d'auteur, la quantité et la substantialité de la partie utilisée, et l'effet sur la valeur marchande de l'œuvre protégée par le droit d'auteur.
  • Perspectives internationales: Différentes juridictions peuvent avoir des positions différentes sur cette question. Par exemple, la directive européenne sur le droit d'auteur peut être interprétée différemment de la loi américaine sur le droit d'auteur.

Q2 : Les résultats de l'IA générative portent-ils atteinte aux droits d'auteur des documents sur lesquels le modèle a été entraîné ?

  • Détermination de l'œuvre dérivée: La production générative est-elle une simple transformation ou crée-t-elle réellement une œuvre dérivée qui enfreint le droit d'auteur ? Cette question pourrait nécessiter une analyse complexe de la similitude et de la créativité.
  • Questions de responsabilité: En cas d'infraction, qui est responsable ? Le créateur de l'IA ? L'utilisateur de l'IA ? Le distributeur ? 

Q3 : L'IA générative enfreint-elle les restrictions relatives à la suppression, à la modification ou à la falsification des informations sur la gestion des droits d'auteur ?

  • Cas particuliers: L'analyse d'algorithmes spécifiques tels que la diffusion stable pourrait être nécessaire pour déterminer si les œuvres générées pourraient accidentellement reproduire ou manipuler des filigranes ou d'autres informations relatives au droit d'auteur.
  • Violation intentionnelle ou accidentelle: Les tribunaux devront peut-être déterminer s'il y avait une intention de supprimer ou d'altérer les informations relatives au droit d'auteur ou s'il s'agissait d'une conséquence involontaire du fonctionnement de l'IA.

Q4 : La création d'un travail dans le style d'une personne viole-t-elle les droits de cette personne ?

  • Définition du droit à l'image: Le droit à l'image varie d'une juridiction à l'autre. Les tribunaux peuvent être amenés à interpréter si la création d'œuvres dans le style d'une personne équivaut à l'utilisation de son image ou de son identité.
  • Utilisation commerciale ou non commerciale: L'application peut différer selon que les résultats de l'IA sont ou non utilisés à des fins commerciales.

Q5 : Comment les licences libres s'appliquent-elles à l'entraînement des modèles d'IA et à la distribution des résultats obtenus ?

  • Comprendre les licences des logiciels libres: Les tribunaux devront peut-être déterminer comment les licences open source s'appliquent aux données d'entraînement de l'IA et aux résultats générés.

Pour l'instant, il nous manque une chose : une décision. À l'heure actuelle, il serait insensé de prédire si l'extraction gratuite de données restera acceptable. Si les créateurs trouvent une faille dans l'armure juridique de l'industrie de l'IA, les dommages pourraient être considérables. Mais il s'agit là d'un grand "si".

Une fois que les décisions commenceront à filtrer et que nous nous rapprocherons de l'entrée en vigueur de la réglementation, l'orientation future de l'IA devrait devenir plus claire. - jusqu'à la prochaine série de défis.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation