Los autores Mona Awad y Paul Tremblay han presentado una demanda contra OpenAI, creador del ChatGPT.
Mona Awad, autora de 13 Ways of Looking at a Fat Girl, y Paul Tremblay, autor de The Cabin at the End of the World, alegan que la plataforma de IA infringió sus derechos de autor al entrenar su modelo con sus obras sin consentimiento.
ChatGPT se entrena con datos disponibles públicamente en Internet. Sin embargo, según Awad y Tremblay, sus novelas protegidas por derechos de autor se utilizaron ilícitamente para entrenar a ChatGPT, una sospecha que surge debido a la capacidad del chatbot para generar "resúmenes muy precisos" de sus libros, como se afirma en los documentos de la demanda.
Los autores argumentan que cuando pidieron a ChatGPT que les proporcionara resúmenes de sus novelas, la IA devolvió información que no es obviamente disponibles públicamente. Aunque ChatGPT podría aprender de los resúmenes publicados en sitios como Wikipedia, éstos no ofrecen detalles suficientes para justificar la profundidad del resumen de la IA. Los demandantes proporcionar pruebas para demostrarlo.
Se trata del primer caso de este tipo contra OpenAI por cuestiones de derechos de autor, afirma Andrés Guadamuz, lector de Derecho de propiedad intelectual en la Universidad de Sussex.
Dicho esto, es la siguiente entrada en una larga lista de casos legales presentados contra OpenAI, aunque la mayoría son casos de difamación.
Además, se han producido varios casos de derechos de autor en el ámbito de la generación de imágenes, entre ellos el de Getty Images, que interpuso un demanda contra Stability AI por utilizar sus imágenes sin compensación.
Uso de "bibliotecas en la sombra" por la IA
Saveri y Butterick afirman que OpenAI se ha vuelto "cada vez más reservada" con respecto a sus datos de entrenamiento, lo que probablemente sea un comentario justo. En las primeras fases de desarrollo de ChatGPT, OpenAI reveló que utilizaba un gran "corpus de libros basados en Internet" para el entrenamiento, apodado "Books2".
Dada la cifra estimada de 294.000 títulos en el conjunto de datos, los abogados sospechan que OpenAI obtuvo los libros de "bibliotecas en la sombra" como Library Genesis (LibGen) y Z-Library. Las llamadas bibliotecas en la sombra son depósitos digitales de libros y artículos académicos.
Aunque se destinan principalmente a uso académico, la mayoría contienen libros copiados ilegalmente.
Hay muy poco consenso sobre las distintas legalidades de las bibliotecas en la sombra, que se han convertido en parte del mobiliario de Internet.
En queja dice"Estas bibliotecas en la sombra, flagrantemente ilegales, interesan desde hace tiempo a la comunidad de entrenamiento de IA".
En un informe de The GuardianLilian Edwards, catedrática de Derecho, Innovación y Sociedad de la Universidad de Newcastle, conjetura que este caso concreto podría depender de si los tribunales consideran que el uso de material protegido por derechos de autor para el entrenamiento de la IA es un "uso justo". Las definiciones de uso legítimo varían de un país a otro, lo que complica aún más el problema.
¿Posibilidades de éxito? Probablemente pocas, pero las presiones legales están aumentando sobre las empresas de IA de todo tipo.
Las próximas normativas sobre IA, como la Ley de AI de la UEestán dispuestos a aplicar directrices de transparencia que obliguen a los desarrolladores a publicar sus datos de formación.