Quoi, encore un ?!
OpenAI et Microsoft ont fait l'objet d'une nouvelle action en justice, impliquant cette fois les médias numériques Raw Story, AlterNet et The Intercept pour des allégations de violation des droits d'auteur.
Ces derniers ont intenté une action en justice contre le duo technologique pour avoir utilisé des contenus protégés par le droit d'auteur sans les citer dans le cadre de l'entraînement de leurs technologies d'intelligence artificielle, en exigeant une compensation financière et en supprimant les contenus des ensembles de données d'entraînement de l'intelligence artificielle.
Il s'agit d'une histoire familière et du deuxième procès intenté à OpenAI au cours des dernières 24 heures, alors qu'Elon Musk tente d'obtenir le remboursement des frais de justice. poursuivre les fondateurs de l'entrepriseGreg Brockman et Sam Altman, pour avoir rompu l'accord fondateur de l'entreprise.
Ce nouveau procès en matière de droits d'auteur allègue que ChatGPT a été formé au journalisme protégé par des droits d'auteur sans le crédit ou la citation nécessaires, et demande au moins $2,500 par infraction.
Les La soumission expliqueLes systèmes d'intelligence artificielle (IA) génératifs et les grands modèles linguistiques (LLM) sont formés à l'aide d'œuvres créées par des humains. Les systèmes d'IA et les LLM ingèrent des quantités massives de créativité humaine et les utilisent pour imiter la façon dont les humains écrivent et parlent. Ces ensembles d'entraînement ont inclus des centaines de milliers, voire des millions, d'œuvres journalistiques".
Elle fait également appel à un étude récente de CopyleaksSelon le site web primé Copyleaks, près de 60% des réponses fournies par le produit GPT-3.5 des défendeurs dans une étude menée par Copyleaks contenaient une forme ou une autre de contenu plagié, et plus de 45% contenaient un texte identique à un contenu préexistant.
Dans une déclaration audacieuse, John Byrne, PDG et fondateur de Raw Story et propriétaire d'AlterNet, a exprimé la frustration croissante que suscitent les pratiques des grandes entreprises technologiques : "Il est temps que les organismes de presse se défendent contre les tentatives incessantes des grandes entreprises technologiques de monétiser le travail d'autrui. Big Tech a décimé le journalisme. Il est temps que les éditeurs prennent position".
À l'instar d'autres actions en justice, la principale préoccupation est que les entreprises d'IA comme OpenAI ont formé leurs modèles sur de grandes quantités de données qu'elles considèrent comme "open source", "dans le domaine public" ou "fair use".
Le problème est que ces concepts sont très ambigus. La loi sur le droit d'auteur elle-même n'a pas été conçue dans l'optique de l'entraînement de modèles d'IA.
OpenAI a récemment répondu à l'action en justice intentée par le New York Times, qui est probablement la plus médiatisée de toutes. Le NYT a payé quelqu'un de "pirater" leurs produits.
L'OpenAI a fait valoir que le NYT utilisait des invites complexes pour produire de force des cas de violation du droit d'auteur.
Cependant, le NYT a répliqué en affirmant que les entreprises d'IA ne divulguant pas leurs données d'entraînement, les gens n'ont d'autre choix que de procéder à une rétro-ingénierie des produits pour les mettre en évidence.
Alors que la tension sur les entreprises d'IA générative augmente, le secteur est à la croisée des chemins.