OpenAI a répondu à deux actions collectives presque identiques intentées contre elle par un certain nombre d'auteurs et a fait valoir que la plupart des allégations devraient être rejetées.
Les auteurs affirment que leurs droits d'auteur ont été violés lorsque l'entreprise a utilisé leur travail comme données d'entraînement pour ChatGPT. Les allégations de l'action en justice sont les suivantes :
- violation directe des droits d'auteur
- violation du droit d'auteur pour le compte d'autrui
- suppression des informations relatives à la gestion des droits d'auteur (DMCA)
- concurrence déloyale
- l'enrichissement sans cause
- négligence
L'OpenAI se réjouit que la première allégation soit débattue devant le tribunal, mais les cinq autres sont erronées en droit et doivent être rejetées.
Les plaignants prétendent que, parce que leurs livres ont été utilisés pour former ChatGPT, tout ce que ChatGPT produit est un dérivé de leur travail protégé par le droit d'auteur.
L'OpenAI déclare qu'elle ne confirmera ni n'infirmera que les livres en question faisaient partie de l'ensemble de données d'entraînement. Mais elle précise que même si les livres ont été inclus dans l'ensemble de données, il s'agit d'une infime partie d'une énorme quantité de données.
OpenAI a fait valoir que cela relevait du principe de l'utilisation équitable, qui n'enfreint pas le droit d'auteur.
Les auteurs pourraient avoir du mal à convaincre le tribunal de leur argument. Ils ne prétendent pas que ChatGPT écrit des livres similaires aux leurs et leur fait concurrence. Ils affirment que chaque mot publié par ChatGPT constitue une violation du droit d'auteur.
Dans sa demande de rejet, OpenAI a déclaré : "Selon les plaintes, chaque résultat de ChatGPT - d'une simple réponse à une question (par exemple, "Oui") au nom du président des États-Unis, en passant par un paragraphe décrivant l'intrigue, les thèmes et l'importance de l'Iliade d'Homère - est nécessairement une "œuvre dérivée" contrefaite des livres des plaignants".
Il sera difficile d'argumenter en ce sens. Même les résumés précis que ChatGPT produit sur les livres en question sont décrits dans la motion comme ressemblant à des "rapports ou critiques de livres" plutôt qu'à une tentative de tirer profit d'un travail protégé par le droit d'auteur.
Les détails des autres arguments peuvent être consultés dans la section Requête en irrecevabilité d'OpenAI.
Pourquoi OpenAI ne demande-t-elle pas le rejet de l'ensemble de l'affaire ?
La motion d'OpenAI précise qu'elle ne demande pas le rejet de l'accusation de violation directe du droit d'auteur "qu'OpenAI cherchera à résoudre en droit à un stade ultérieur de l'affaire".
OpenAI et Meta n'ont pas divulgué exactement les données qu'ils ont utilisées pour entraîner leurs modèles, mais il est presque certain qu'elles comprennent beaucoup de matériel protégé par le droit d'auteur, y compris les livres des auteurs qui ont intenté les poursuites.
Si des données protégées par le droit d'auteur ont été incluses, OpenAI en était certainement consciente. L'entreprise soutiendra que l'intention derrière l'accès au matériel n'était pas de produire des œuvres dérivées et d'en tirer profit en concurrence avec les originaux.
Si le tribunal donne son accord, cette décision créera un précédent sur lequel s'appuieront un certain nombre d'autres procès en cours liés à l'IA.
Une décision en sa faveur signifiera qu'elle ne pourra pas être poursuivie pour avoir utilisé des données protégées par le droit d'auteur dans le passé et qu'elle pourra continuer à le faire pour entraîner ses nouveaux modèles. Et si le tribunal décide que la formation à l'IA relève du principe de l'utilisation équitable, les autres entreprises d'IA pourront également en profiter.
Il s'agit d'une démarche risquée, mais à un moment donné, cette question devra être résolue. Si la décision va à l'encontre d'OpenAI, l'entreprise devra abandonner ChatGPT et recommencer à l'entraîner à partir de zéro. Cette fois, avec un ensemble de données beaucoup plus restreint.