Le New York Times envisage d'intenter une action en justice contre OpenAI, soupçonnée de s'être emparée de son contenu pour entraîner ChatGPT.
OpenAI admet qu'elle a exploité des données librement disponibles sur l'internet, mais elle n'a pas divulgué la nature exacte des données utilisées. L'entreprise n'a pas obtenu l'autorisation d'utiliser les données, mais les lois relatives à l'extraction de données pour l'apprentissage de l'IA ne sont pas claires.
Outre la question de l'utilisation de ses données sans autorisation, le NYT craint que les réponses de ChatGPT n'entrent en concurrence avec son propre contenu, en plus de constituer une violation des droits d'auteur.
Si un utilisateur interroge ChatGPT sur un événement d'actualité, la réponse peut potentiellement contenir une paraphrase basée sur un reportage publié à l'origine par le NYT.
Avant ChatGPT (BC ?), un utilisateur tapait la question dans Google, puis cliquait sur le site web du NYT, où l'entreprise de médias pouvait monétiser son contenu publié. Aujourd'hui, un utilisateur peut potentiellement obtenir la réponse sans qu'aucun revenu ne revienne à l'entreprise qui a créé le contenu.
Que pourrait-il se passer si le NYT poursuit OpenAI ?
Il y a beaucoup de "si", mais si le NYT rejoint la liste croissante d'autres personnes qui poursuivent OpenAI et gagne son procès, il pourrait y avoir de sérieuses conséquences.
La loi fédérale sur les droits d'auteur stipule que si OpenAI a délibérément enfreint les droits d'auteur, elle pourrait se voir infliger des amendes allant jusqu'à $150 000 pour chaque infraction. Le NYT dispose d'un énorme dépôt de documents archivés. Selon la manière dont le juge considère les "infractions individuelles", l'amende pourrait mettre fin à l'existence de l'entreprise.
La loi fédérale sur le droit d'auteur permet également de détruire le matériel qui a violé le droit d'auteur. C'est un énorme problème pour OpenAI. Le matériel incriminé est l'ensemble de données d'entraînement pour ChatGPT.
Si elle est détruite, cela signifie qu'OpenAI doit reconstruire ChatGPT à partir de zéro. Et cette fois-ci, sans bénéficier de l'accaparement gratuit des données Internet.
Que font les autres entreprises de médias ?
Barry Diller, président d'IAC, est à la tête d'une coalition d'éditeurs importants qui intentent collectivement des actions en justice contre des sociétés d'IA afin d'obtenir une compensation pour ce qu'ils considèrent comme des violations de leurs droits d'auteur.
Le NYT a entamé des discussions avec le groupe, mais a ensuite a refusé de rejoindre sa coalition.
En juillet, l'Associated Press a conclu un accord avec OpenAI pour l'exploitation sous licence de son contenu remontant à 1985. L'accord reconnaît les avantages mutuels de l'utilisation par l'AP de l'IA générative d'OpenAI dans le cadre de ses activités.
Dans un communiqué commun, les deux entreprises ont déclaré : "L'accord prévoit qu'OpenAI octroie une licence pour une partie des archives textuelles d'AP, tandis qu'AP tirera parti de la technologie et de l'expertise d'OpenAI en matière de produits".
Cet accord est probablement un bon exemple de la manière dont beaucoup de ces questions entre les éditeurs et les entreprises d'IA seront résolues. Ce scénario représente probablement le meilleur cas de figure pour OpenAI.
Mais, avec des batailles juridiques de plus en plus nombreuses et relations tendues avec son principal investisseurLes choses semblent aller de mal en pis pour OpenAI.