Les auteurs Mona Awad et Paul Tremblay ont intenté une action en justice contre OpenAI, le créateur du ChatGPT.
Mona Awad, auteur de 13 Ways of Looking at a Fat Girl, et Paul Tremblay, auteur de The Cabin at the End of the World, allèguent que la plateforme d'IA a violé leurs droits d'auteur en entraînant son modèle sur leurs œuvres sans leur consentement.
ChatGPT est formé à partir de données publiques disponibles sur Internet. Pourtant, selon Awad et Tremblay, leurs romans protégés par le droit d'auteur ont été utilisés illicitement pour entraîner ChatGPT, un soupçon soulevé par la capacité du chatbot à générer des "résumés très précis" de leurs livres, comme l'indiquent les documents du procès.
Les auteurs affirment que lorsqu'ils ont demandé à ChatGPT de fournir des résumés de leurs romans, l'IA a renvoyé des informations qui ne sont pas des résumés. évidemment publiquement disponibles. Bien que ChatGPT puisse apprendre des résumés publiés sur des sites tels que Wikipedia, ceux-ci ne fournissent pas suffisamment de détails pour justifier la profondeur du résumé de l'IA. Les plaignants fournir des expositions pour le démontrer.
Selon Andres Guadamuz, lecteur en droit de la propriété intellectuelle à l'université du Sussex, il s'agit de la première action de ce type contre OpenAI en matière de droits d'auteur.
Ceci étant dit, il s'agit de la prochaine étape d'une longue série d'actions en justice intentées contre OpenAI, bien que la plupart d'entre elles ne soient pas encore terminées. affaires de diffamation.
En outre, il y a eu plusieurs affaires de droits d'auteur dans le domaine de la génération d'images, y compris Getty Images, qui a déposé une demande d'autorisation d'utilisation de l'Internet pour la génération d'images. action en justice contre Stability AI pour l'utilisation de ses images sans compensation.
Utilisation de "bibliothèques fantômes" par l'IA
Saveri et Butterick affirment qu'OpenAI est devenue "de plus en plus secrète" en ce qui concerne ses données de formation, ce qui est probablement un commentaire juste. Lors des premières phases de développement de ChatGPT, OpenAI a révélé qu'elle utilisait un vaste "corpus de livres basé sur Internet" pour l'entraînement, baptisé "Books2".
Étant donné que l'ensemble des données contient environ 294 000 titres, les avocats soupçonnent OpenAI de s'être procuré les livres auprès de "bibliothèques fantômes" telles que Library Genesis (LibGen) et Z-Library. Les bibliothèques dites "fantômes" sont des dépôts numériques de livres et d'articles universitaires.
Bien qu'ils soient principalement destinés à un usage universitaire, la plupart d'entre eux contiennent des livres copiés illégalement.
Il y a très peu de consensus sur les différentes légalités des bibliothèques fantômes - elles font désormais partie du mobilier de l'internet.
Les plainte ditCes bibliothèques fantômes manifestement illégales intéressent depuis longtemps la communauté des spécialistes de l'apprentissage de l'IA.
Dans un rapport du GuardianLilian Edwards, professeur de droit, d'innovation et de société à l'université de Newcastle, estime que ce cas particulier pourrait dépendre de la question de savoir si les tribunaux considèrent l'utilisation de matériel protégé par le droit d'auteur pour l'entraînement à l'intelligence artificielle comme un "usage loyal". Les définitions de l'utilisation équitable varient d'un pays à l'autre, ce qui complique encore le problème.
Quelles sont les chances de succès ? Probablement faibles, mais les pressions juridiques s'accentuent sur les entreprises d'IA de toutes sortes.
Les prochaines réglementations sur l'IA, comme la Loi européenne sur l'IALa Commission européenne et les États membres de l'Union européenne sont sur le point d'appliquer des lignes directrices en matière de transparence qui obligent les développeurs à publier leurs données d'entraînement.