OpenAI : il est "impossible" de créer des outils d'IA sans utiliser de matériel protégé par le droit d'auteur

8 janvier 2024

Règlement OpenAI

Dans une déclaration de preuves écrites adressée à la Chambre des Lords du Royaume-Uni, OpenAI a déclaré qu'il était "impossible" de créer des outils d'IA sans utiliser de matériel protégé par le droit d'auteur.

Cette décision intervient dans un contexte d'intensification du débat sur l'interaction entre le droit d'auteur et l'IA. Des auteurs, des écrivains et des médias tels que le New York Times ont intenté des actions en justice contre OpenAI, Microsoft, Stability AI, Anthropic, Google et Midjourney, pour n'en citer que quelques-unes. 

Les grands modèles de langage (LLM) tels que ChatGPT et les générateurs d'images tels que Midjourney, qui a récemment fait la une des journaux pour avoir créé un modèle d'image, sont des outils très utiles. base de données de 16 000 artistes à des fins de formation de modèles, s'appuient sur de nombreuses données protégées par le droit d'auteur pour leur formation. 

En fait, les données relatives aux droits d'auteur constituent la base du matériel de formation à l'IA, car elles sont abondantes, couvrent un large éventail de la créativité humaine et sont facilement accessibles sur l'internet. 

Les entreprises spécialisées dans l'IA soutiennent que ces données sont "loyales" pour l'entraînement de leurs modèles, mais beaucoup d'autres ne sont pas d'accord.  

En réponse au comité restreint sur les communications et le numérique de la Chambre des Lords, OpenAI a récemment souligné son besoin de matériel protégé par le droit d'auteur pour les formations LLM telles que GPT-4.

L'OpenAI a déclaré : "Comme le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine - y compris les articles de blog, les photographies, les messages de forum, les bouts de code de logiciel et les documents gouvernementaux - il serait impossible d'entraîner les meilleurs modèles d'IA actuels sans utiliser des documents protégés par le droit d'auteur".

L'entreprise a également fait valoir que le fait de limiter les supports de formation aux sources du domaine public entraînerait la création de systèmes d'intelligence artificielle de mauvaise qualité. 

"Limiter les données d'entraînement aux livres du domaine public et aux dessins créés il y a plus d'un siècle pourrait donner lieu à une expérience intéressante, mais ne permettrait pas de fournir des systèmes d'IA répondant aux besoins des citoyens d'aujourd'hui", a ajouté l'OpenAI.

Vous pouvez lire l'intégralité du soumission de preuves écrites iciqui aborde également la trajectoire future de l'IA, les risques catastrophiques, pour lesquels OpenAI annonce son Frontier Model Forum et son équipe de préparation, et la réglementation. 

Le public réagit

Les réactions à ces déclarations n'ont pas vraiment été sympathiques.

Gary Marcus, par exemple, un éminent représentant de l'industrie, a déclaré que cela revient à étiqueter les modèles d'IA comme un dispositif de monétisation des œuvres protégées par le droit d'auteur qui ont été volées.

En effet, il semble qu'il s'agisse presque d'un lapsus freudien de la part d'OpenAI, qui admet que son modèle économique est irréalisable sans manipuler la loi.

Il y a un sentiment d'injustice palpable dans le fait que si peu de personnes dans les hautes sphères de la Silicon Valley bénéficient du travail de tant de personnes.

La déclaration d'OpenAI affirme également qu'elle comprend "les besoins" des "citoyens" d'aujourd'hui, ce qui révèle un fossé de plus en plus profond entre l'idée que les grandes entreprises technologiques se font de l'IA générative comme d'un projet humanitaire, voire philanthropique, et les craintes des citoyens de se faire voler leurs données et de voir leurs compétences supplantées.

Le Dr Marcus a déclaré : " [Les entreprises d'IA]...devrait retourner à la planche à dessin et trouver comment construire des logiciels qui n'ont pas de problème de plagiat, plutôt que de plumer les artistes, les écrivains et les autres fournisseurs de contenu". 

Les procès s'accumulent

Cette décision intervient également alors que plusieurs procès ont été intentés à l'encontre d'OpenAI, avec des auteurs de renom tels que John Grisham, Jodi Picoult et George RR Martin poursuit l'entreprise en septembre l'année dernière pour "vol systématique à grande échelle". 

Deux journalistes estimés, Nicholas Gage et Nicholas Basbanes, ont déposé une nouvelle plainte contre OpenAI et Microsoft la semaine dernièreCette décision s'ajoute au nombre croissant de problèmes juridiques auxquels sont confrontées les entreprises du secteur de l'IA dans les domaines de l'écriture et des arts visuels.

OpenAI a également réagi à l'action en justice du New York Times en déclarant qu'elle était "sans fondement" (voir ci-dessous).

Ces évolutions soulèvent des inquiétudes quant aux responsabilités juridiques potentielles auxquelles les entreprises d'IA pourraient être confrontées cette année et à l'avenir. Comment s'adapteront-elles ? La résistance croissante du public aura-t-elle un impact sur la trajectoire de l'industrie ?

Et comment former de manière éthique des modèles d'IA générative à grande échelle ? L'éthique est-elle même compatible avec l'incarnation actuelle de la technologie ? 

Les défenses des entreprises d'IA tiennent jusqu'à présent, mais le fossé entre l'idée que les développeurs d'IA se font de l'"utilisation équitable" et la façon dont les autres la perçoivent se creuse de plus en plus. 

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation