La batalla entre los artistas y los generadores de imágenes por IA

5 de agosto de 2023

Derecho de la IA

Artistas y creadores ponen en jaque a los desarrolladores de IA por posibles infracciones de los derechos de autor.

Escriba un mensaje en un generador de imágenes de IA como DALL-E, MidJourney o Stable Diffusion, y producirá una imagen aparentemente única en cuestión de segundos.

A pesar de su aparente singularidad, tstas imágenes se generan a partir de miles de millones de otras imágenes mediante lo que puede describirse como una compleja técnica de collage digital.

Las imágenes proceden de fuentes "públicas" o "abiertas". 

Si le preguntas a ChatGPT cómo funciona un generador de imágenes como DALL-E, te dirá algo así como: "Piensa en DALL-E como en un artista digital superavanzado, que ha visto millones de imágenes y puede dibujar una nueva basándose en tu descripción, intentando que sea lo más exacta posible. Lo hace mezclando y combinando elementos que ha aprendido de sus "observaciones" anteriores".

Es un poco como recorrer las galerías de arte del mundo y hacer fotos de cada obra, con la diferencia de que no te pueden echar. 

En Internet no hay guardias de seguridad ni cámaras que vigilen a la gente para evitar la piratería o el robo, y la práctica del data scraping -que consiste en recopilar datos de Internet con el servicio de bots- siempre ha ocupado un territorio jurídico nebuloso. 

Los artistas sostienen que entrenar IAs de texto a imagen en conjuntos de datos públicos equivale al mayor robo de arte del mundo.

¿Cómo hacen sentir a los artistas los detectores de IA?

Para algunos artistas de éxito cuyas obras han sido copiadas miles -incluso millones- de veces, las repercusiones del arte generado por la IA han hecho difícil distinguir entre su propia obra y las copias de la IA.

Las diferencias estéticas son simplemente demasiado pequeñas, probablemente porque las imágenes populares aparecen prolíficamente en los conjuntos de datos. 

Entre ellos está Greg Rutowski, que dijo: "Mi trabajo se ha utilizado en IA más que Picasso". 

Greg Rutowski
La obra de Greg Rutowski ha sido copiada miles de veces: Fuente: MIT.

Las ilustraciones de fantasía de Rutowki aparecen en franquicias como Dragones y Mazmorras y Magic: The Gathering, y pueden reproducirse mediante generadores de texto a imagen simplemente añadiendo el nombre del artista a la pregunta, por ejemplo, "Crea un dragón luchando contra un ogro al estilo de Greg Rutowski". 

Él a la BBCEl primer mes que lo descubrí, me di cuenta de que afectaría claramente a mi carrera y no podría reconocer y encontrar mis propias obras en Internet", y añadió: "Los resultados se asociarán a mi nombre, pero no será mi imagen. No será creada por mí. Así que añadirá confusión a la gente que descubra mis obras".

Y continuó: "Todo aquello en lo que hemos trabajado durante tantos años nos ha sido arrebatado tan fácilmente con la IA". 

La última afirmación da realmente en el blanco, ya que la reproducción de obras complejas y talentosas por parte de la IA se realiza en cuestión de segundos, lo que significa que no sólo el trabajo de los artistas se vuelve redundante, sino que se pierden las habilidades utilizadas para crearlo.

La humanidad la falta de competencias y conocimientos auténticos es uno de los riesgos más acuciantes de la IA, bautizado como "debilitamiento,", ilustrado por la película de Disney WALL-E, donde los humanos pierden la capacidad de moverse a causa de la tecnología. 

Otra artista que ha denunciado la reproducción de sus obras por la IA es Kelly McKernan, ilustradora afincada en Tennessee que descubrió que más de 50 obras suyas figuraban como datos de entrenamiento en la Red Abierta de Inteligencia Artificial a Gran Escala (LAION).

Puede buscar unos 5.800 millones de imágenes encontradas en conjuntos de entrenamiento de IA con la herramienta "¿He recibido formación?"Así es como McKernan conoció su trabajo. 

¿He recibido formación? ofrece un servicio de búsqueda en bases de datos de imágenes de código abierto.

LAION es una organización sin ánimo de lucro que crea modelos y conjuntos de datos de código abierto, muchos de los cuales se han utilizado para entrenar modelos de conversión de texto en imágenes de alto nivel, como Stable Diffusion e Imagen.

"De repente, todos estos cuadros con los que había tenido una relación personal y un viaje, adquirieron un nuevo significado, cambió mi relación con esas obras de arte", dijo McKernan.

Batallas legales en curso 

McKernan, junto con sus colegas Sarah Anderson y Karla Ortiz, ha emprendido acciones legales contra Stability AI, DeviantArt y Midjourney.

Su demanda se suma a una oleada de acciones legales contra empresas de IA tanto por parte de escritores como de artistas visuales. 

Empresas más grandes también han demandado o tienen previsto demandar a desarrolladores de IA, como Getty Images, que alegó que Stability AI había copiado y procesado ilegalmente 12 millones de sus imágenes sin permiso.

McKernan declaró: "Tal como están las cosas, los derechos de autor sólo pueden aplicarse a mi imagen completa. Espero que [la demanda] fomente la protección de los artistas para que la IA no pueda utilizarse para sustituirnos. Si ganamos, espero que se pague a muchos artistas. Es mano de obra gratuita y algunos se están aprovechando".

El estilo de McKernan, que se ve a continuación, ha sido solicitado en unas 12.000 prompts de MidJourney. 

 

Ver esta publicación en Instagram

 

Una publicación compartida por Kelly McKernan (@kelly_mckernan)

Una cuestión fundamental aquí es que la ley de derechos de autor simplemente no se construyó para la era de la IA.

Liam Budd, del sindicato de las artes escénicas y el espectáculo Equity, abogó por una legislación actualizada que refleje las potenciales oportunidades de negocio que ofrece la IA generativa. 

Él declaró"Necesitamos más claridad en la legislación y estamos haciendo campaña para que se actualice la Ley de Propiedad Intelectual".

En respuesta a la creciente oleada de infracciones de los derechos de autor cometidas por la IA, varias jurisdicciones, como la UE, han propuesto que los desarrolladores de IA revelen cualquier material protegido por derechos de autor utilizado para el entrenamiento. 

¿Será suficiente? ¿Han demostrado ya los desarrolladores de IA que es probable que se salgan con la suya?

Al fin y al cabo, la mayoría de estos conjuntos de datos ya están ensamblados, y las empresas de IA podrían argumentar que se limitan a actualizar modelos para eludir la necesidad de declarar material protegido por derechos de autor.

¿Tienen las demandas un fundamento jurídico sólido?

Esta ronda actual de demandas colectivas gira en gran medida en torno a dos argumentos. 

  • En primer lugar, la alegación de que las empresas han infringido los derechos de autor de los artistas al utilizar sus obras sin permiso. 
  • En segundo lugar, la alegación de que los resultados de la IA son esencialmente contenidos derivados debido a su inclusión en los datos de entrenamiento. 

La aplicación de estos argumentos difiere en todo el mundo, como en EE.UU., donde las leyes de "uso justo" suelen ser más liberales que en la UE. Esto complica aún más el panorama de los derechos de autor de la IA. Si las empresas operan en el Reino Unido, por ejemplo, puede que les resulte más difícil argumentar el "uso legítimo".

Además, se está demandando a las empresas de IA generativa, no a las entidades que recopilan los conjuntos de datos, como LAION en el caso de MidJourney. Eliana Torres, abogada especializada en propiedad intelectual del bufete Nixon Peabody, señala que si LAION creó el conjunto de datos, la presunta infracción se produjo en ese momento, no cuando el conjunto de datos se utilizó para entrenar los modelos.

Por otra parte, demostrar que las obras generadas por la IA son reproducciones de obras originales es un reto debido a la compleja naturaleza de la IA, que utiliza el procesamiento algorítmico para descomponer y volver a ensamblar las imágenes.

A los organismos reguladores les han pillado desprevenidos las implicaciones jurídicas de la IA generativa y, aunque se están desarrollando soluciones provisionales como filtros automáticos y disposiciones de exclusión voluntaria para los artistas, puede que no sean suficientes. 

Hasta que los jueces se pronuncien sobre casos concretos, lo que podría llevar meses, las empresas de IA generativa se exponen a importantes riesgos jurídicos en muchas jurisdicciones. 

La historia indica que la legislación sobre derechos de autor puede adaptarse a las nuevas tecnologías, pero hasta que no se llegue a un consenso, tanto los artistas como los desarrolladores de inteligencia artificial están muy a oscuras. 

Los jueces frenan las demandas judiciales

Hasta ahora, los jueces han dado a los artistas pocos motivos para ser optimistas. 

Por ejemplo, el juez de distrito estadounidense William Orrick puso en duda la demanda contra Kelly McKernan.

Según el juez OrrickMcKernan y los demás demandantes debían "aportar más datos" sobre la supuesta infracción de los derechos de autor y diferenciar claramente sus demandas contra cada empresa (Stability AI, DeviantArt y Midjourney). 

Orrick señaló que los sistemas se habían entrenado con "cinco mil millones de imágenes comprimidas", por lo que los artistas deben aportar pruebas más sólidas de que sus obras estaban específicamente implicadas en la supuesta infracción de los derechos de autor. A sitio web de seguimiento de esta demanda ha subido recientemente información técnica sobre cómo funcionan estos modelos interpolando el contenido de las imágenes de su conjunto de entrenamiento. 

El caso está representado por la Despacho de abogados Joseph Saverique también representa al menos otros 5 casos similares contra empresas de IA.

Y de nuevo, los derechos de autor se infringen potencialmente en la recogida de datos y no en su generación. 

La sección 1202(b) de la Ley de Derechos de Autor para el Milenio Digital de Estados Unidos "se refiere a 'copias' idénticas... de una obra, no a fragmentos y adaptaciones", por lo que argumentar que las obras se "copian" mediante el proceso del modelo de IA es potencialmente endeble. 

Las opiniones de Orrick también plantean dudas sobre la responsabilidad de empresas como MidJourney y DeviantArt, que incorporan la tecnología Stable Diffusion de Stability AI a sus propios sistemas de IA generativa. 

Ii a los desarrolladores de IA, como OpenAI, Meta, etc., se les atribuye cierta responsabilidad por infringir los derechos de autor de los artistas, son vulnerables a otras acciones legales. 

Los autores y escritores también se lanzan a los litigios 

En otro demanda recienteLa comediante y escritora estadounidense Sarah Silverman y los autores Christopher Golden y Richard Kadrey alegan que sus palabras se utilizaron ilegalmente para entrenar modelos de IA como ChatGPT y LLaMA.

La demanda hace alegaciones paralelas a las presentadas por los artistas plásticos, pero esta vez, las IA están entrenadas con datos de texto públicos. 

La demanda alega que ChatGPT fue capaz de resumir con precisión libros como "The Bedwetter" de Silverman, "Ararat" de Golden y "Sandman Slim" de Kadrey. Y lo que es más importante, el nivel de detalle de los resúmenes no puede explicarse por los extractos de los libros subidos a Wikipedia o a los sitios web de las librerías. 

Los demandantes acusan a OpenAI y Meta de utilizar sin consentimiento libros protegidos por derechos de autor procedentes de "bibliotecas en la sombra". 

Las bibliotecas en la sombra, como Bibliotik, Library Genesis y Z-Library, albergan grandes cantidades de información copiada ilegalmente. 

Biblioteca
Library Genesis ya se había enfrentado anteriormente a acciones legales y se le ordenó que cerrara su sitio web, pero los organizadores se limitaron a abrir nuevos dominios. Fuente: Wikipedia.

Aunque es evidente que las empresas de IA han monetizado productos con la ayuda de obras protegidas por derechos de autor, cuentan con varias capas de protección, entre ellas la naturaleza intrínsecamente compleja de sus modelos y el espacio idiosincrásico que ocupan en el panorama moral, ético y jurídico.

¿Qué tienen que decidir los tribunales? 

Mientras los reguladores siguen deliberando sobre las normas relativas a la IA, los jueces podrían ser los primeros en dar forma al futuro panorama de los derechos de autor.

Esto podría dar lugar a un mosaico legislativo limitado por las especificidades de cada caso y la jurisdicción en la que se dictó sentencia.

Actualmente, hay muchas preguntas que responder, entre ellas: 

P1: ¿Es necesario obtener una licencia para entrenar a un modelo con material protegido por derechos de autor?

  • Uso legítimo frente a licencia: Es posible que los tribunales tengan que decidir si la copia temporal de datos durante la formación entra dentro del "uso legítimo", que permitiría el uso sin licencia. Esto podría depender de factores como la finalidad de la copia, la naturaleza de la obra protegida por derechos de autor, la cantidad y sustancialidad de la parte utilizada y el efecto sobre el valor de mercado de la obra protegida por derechos de autor.
  • Perspectivas internacionales: Las distintas jurisdicciones pueden tener posturas diferentes al respecto. Por ejemplo, la Directiva sobre derechos de autor de la UE podría interpretarse de forma diferente a la Ley de derechos de autor de Estados Unidos.

P2: ¿Los resultados de la IA generativa infringen los derechos de autor de los materiales sobre los que se ha entrenado el modelo?

  • Determinación de la obra derivada: ¿El resultado generativo es simplemente una transformación o crea realmente una obra derivada que infringe los derechos de autor? Esta pregunta podría requerir un complejo análisis de la similitud y la creatividad.
  • Cuestiones de responsabilidad: Si hay infracción, ¿quién es responsable? ¿El creador de la IA? ¿El usuario de la IA? ¿El distribuidor? 

P3: ¿Infringe la IA generativa las restricciones sobre eliminación, alteración o falsificación de la información de gestión de derechos de autor?

  • Casos específicos: El análisis de algoritmos específicos como el de difusión estable podría ser necesario para determinar si las obras generadas podrían reproducir o manipular accidentalmente marcas de agua u otra información sobre derechos de autor.
  • Infracción intencionada o accidental: Es posible que los tribunales tengan que determinar si hubo intención de eliminar o alterar información sobre derechos de autor o si fue una consecuencia involuntaria del funcionamiento de la IA.

P4: ¿Generar obras al estilo de alguien vulnera los derechos de esa persona?

  • Definición del derecho de publicidad: El derecho de publicidad varía de una jurisdicción a otra. Los tribunales pueden tener que interpretar si crear obras al estilo de alguien equivale a utilizar su imagen o identidad.
  • Uso comercial y no comercial: La aplicación puede variar en función de si los resultados de la IA se utilizan o no con fines comerciales.

P5: ¿Cómo se aplican las licencias de código abierto al entrenamiento de modelos de IA y a la distribución de los resultados?

  • Licencias de código abierto: Los tribunales pueden tener que determinar cómo se aplican las licencias de código abierto a los datos de entrenamiento de IA y a los resultados generados.

Ahora mismo, nos falta una cosa: una sentencia. En este momento, sería una locura predecir si la extracción gratuita de datos seguirá siendo aceptable. Si los creadores encuentran una grieta en la armadura legal de la industria de la IA, el daño podría ser considerable. Pero parece un gran "si".

Una vez que las sentencias empiecen a filtrarse y nos acerquemos a la entrada en vigor de la normativa, la dirección futura de la IA será más clara. - hasta la próxima serie de desafíos.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales