¿Qué, otro más?
OpenAI y Microsoft han sido objeto de una nueva demanda, esta vez contra los medios digitales Raw Story, AlterNet y The Intercept por supuesta violación de derechos de autor.
Estas empresas han emprendido acciones legales contra el dúo tecnológico por utilizar contenidos protegidos por derechos de autor para entrenar sus tecnologías de IA, exigiendo una compensación económica y la eliminación de los contenidos de los conjuntos de datos de entrenamiento de la IA.
Es una historia conocida y la segunda demanda a la que se enfrenta OpenAI en las últimas 24 horas, ya que Elon Musk intenta demandar a los fundadores de la empresaGreg Brockman y Sam Altman, por romper el acuerdo de fundación de la empresa.
Esta nueva demanda por derechos de autor alega que ChatGPT se formó sobre periodismo protegido por derechos de autor sin el crédito o la cita necesarios, con demandas de al menos $2.500 por infracción.
En la presentación explicaLos sistemas de inteligencia artificial (IA) generativa y los grandes modelos lingüísticos (LLM) se entrenan con obras creadas por humanos. Los sistemas de IA y los LLM ingieren cantidades ingentes de creatividad humana y la utilizan para imitar cómo escriben y hablan los humanos. Estos conjuntos de entrenamiento han incluido cientos de miles, si no millones, de obras periodísticas".
También hace un llamamiento a estudio reciente de Copyleaks, afirmando: "Según el galardonado sitio web Copyleaks, casi 60% de las respuestas proporcionadas por el producto GPT-3.5 de los demandados en un estudio realizado por Copyleaks contenían alguna forma de contenido plagiado, y más de 45% contenían texto idéntico a contenido preexistente".
En una audaz declaración, John Byrne, director general y fundador de Raw Story y propietario de AlterNet, expresó la creciente frustración con las prácticas de las grandes empresas tecnológicas: "Es hora de que las organizaciones de noticias se defiendan de los continuos intentos de las grandes empresas tecnológicas de monetizar el trabajo de otras personas. Las grandes tecnológicas han diezmado el periodismo. Es hora de que los editores tomen partido".
Al igual que otras demandas, la principal preocupación en este caso es que las empresas de IA como OpenAI entrenaron sus modelos con grandes cantidades de datos que creen que son de "código abierto", "de dominio público" o de "uso justo".
La cuestión es que estos conceptos son muy ambiguos. La propia ley de derechos de autor no se diseñó pensando en la formación de modelos de IA.
OpenAI ha respondido recientemente a la demanda del New York Times, que es probablemente la de más alto perfil de todas, alegando que la NYT pagó a alguien para 'hackear' sus productos.
OpenAI argumentó que el NYT utilizó mensajes complejos para producir a la fuerza casos de infracción de los derechos de autor.
Sin embargo, el NYT contraatacó afirmando que, dado que las empresas de IA no revelan sus datos de entrenamiento, no queda más remedio que aplicar ingeniería inversa a los productos para sacarlos a la luz.
A medida que aumenta la tensión sobre las empresas de IA generativa, el sector se acerca a una encrucijada.