OpenAI ha pedido a un juez que desestime la demanda de The New York Times contra Microsoft y OpenAI, acusando al periódico de "piratear" sus productos.
Acusan a The New York Times de fabricar infracciones de derechos de autor mediante un proceso exhaustivo y manipulador que implica "decenas de miles de intentos" y "avisos engañosos que violan flagrantemente las condiciones de uso de OpenAI".
El escrito judicial, redactado en términos contundentes, comienza así: "Las alegaciones de la demanda del Times no se ajustan a sus famosas y rigurosas normas periodísticas. La verdad, que saldrá a la luz en el curso de este caso, es que el Times pagó a alguien para que pirateara los productos de OpenAI."
El New York Times es buscando grandes daños tanto de Microsoft como de OpenAI.
Aunque hay un pila cada vez mayor de demandas Este caso, en el que están implicadas empresas de IA de todos los rincones de las industrias creativas, está llamado a marcar un hito. Podría remodelar el panorama del desarrollo de la IA y la legislación sobre derechos de autor.
Sin embargo, puede estar seguro de que las grandes tecnológicas lucharán con uñas y dientes. "La gente normal no utiliza los productos de OpenAI de esta manera", afirmó OpenAI en su reciente presentación.
El término "ingeniería rápida" o "red-teaming", como menciona OpenAI en su presentación legal, actúa como una prueba de estrés diseñada para descubrir vulnerabilidades en los sistemas de IA.
Alimentar los sistemas de IA generativa con estímulos diseñados específicamente les obliga a anular sus barreras de protección y a comportamiento errático.
Esto ha dado lugar a una serie de respuestas extrañas y potencialmente peligrosas, como ofrecer ayudar a fabricar bombas o fomentar el suicidio y otras actividades perjudiciales.
Presentación de OpenAI, disponible aquí, es feroz, y continúa: "OpenAI y los demás demandados en estos pleitos acabarán imponiéndose porque nadie -ni siquiera el New York Times- consigue monopolizar los hechos o las reglas del lenguaje".
También afirma: "Sin embargo, contrariamente a las alegaciones de la demanda, ChatGPT no sustituye en modo alguno a una suscripción a The New York Times. En el mundo real, la gente no utiliza ChatGPT ni ningún otro producto de OpenAI con ese fin. Ni podrían hacerlo".
Esto es crucial, ya que el NYT tiene que convencer al juez de los daños económicos derivados de la infracción de OpenAI.
Derechos de autor: ¿uso justo o laguna jurídica?
Es un secreto a voces que los modelos generativos de IA se entrenan fácilmente con datos de derechos de autor, algunos en mayor medida que otros.
OpenAI lo admitió en un presentación previa a la Cámara de los Lores del Reino UnidoComo los derechos de autor cubren hoy prácticamente todo tipo de expresión humana -incluidas entradas de blog, fotografías, mensajes de foros, fragmentos de código de software y documentos gubernamentales-, sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor".
OpenAI prosiguió en lo que algunos consideraron un desliz freudiano: "Limitar los datos de entrenamiento a libros y dibujos de dominio público creados hace más de un siglo podría dar lugar a un experimento interesante, pero no proporcionaría sistemas de IA que satisfagan las necesidades de los ciudadanos de hoy".
No hay duda de que las empresas de IA pretenden utilizar datos protegidos por derechos de autor. Pero eso no significa que la ley de derechos de autor, una construcción anterior a la IA, no esté de su parte.
Durante un debate en Davos (Suiza), el director ejecutivo de OpenAI, Sam Altman, expresó su asombro por la demanda del NYT, aclarando una idea errónea muy extendida sobre la necesidad de los datos del periódico para entrenar los modelos de OpenAI.
"En realidad, no necesitamos entrenarnos con sus datos", afirma Altman, que destaca el impacto insignificante de excluir los datos de un único editor en el rendimiento de ChatGPT.
No obstante, OpenAI reconoce el posible efecto acumulativo de que varios editores retiren sus contenidos y está consiguiendo acuerdos para utilizar los contenidos de los medios de comunicación con fines de entrenamiento de la IA.
A estudio reciente del Instituto Reuters para el Estudio del Periodismo de la Universidad de Oxford descubrió que unos 48% de los principales sitios de noticias bloquean ahora los rastreadores web de OpenAI, lo que podría limitar gravemente el acceso de la empresa a datos frescos y de alta calidad.
OpenAI y otras empresas tecnológicas probablemente tendrán que empezar a pagar por los datos, pero seguirán sin ser sancionadas por sus hazañas hasta ahora.