OpenAI y MidJourney quieren comprar datos de WordPress y Tumblr

28 de febrero de 2024

AI tumblr wordpress

Automattic, la empresa que está detrás de WordPress y Tumblr, está negociando un acuerdo de datos y contenidos con MidJourney y OpenAI.

Esta información, inicialmente cubierta por 404 Medios de comunicación y basándose en informes de una fuente anónima de Automattic, indica que podría ser inminente un acuerdo con OpenAI y MidJourney.  

Esto sigue a los rumores que circulan en Tumblr sobre un posible acuerdo con MidJourney que podría introducir una nueva fuente de ingresos para la plataforma.

404 dice que el proceso de acuerdo ha sido desordenado hasta ahora, incluyendo una transferencia de datos parcialmente fallida a OpenAI y MidJourney que contenía, en palabras de uno de los jefes de producto de Tumblr:

"Mensajes privados en blogs públicos, mensajes en blogs eliminados o suspendidos, preguntas no respondidas (normalmente no son públicas hasta que se responden), respuestas privadas (sólo aparecen para el receptor y no son públicas), mensajes marcados como 'explícitos' / NSFW / 'maduros' según nuestros estándares más modernos (puede que esto no sea para tanto, no lo sé)."

Las implicaciones de este acuerdo aún no están claras y se esperan más detalles al respecto.

La fiebre del oro por los datos de entrenamiento de IA sube de nivel

Y así de fácil, la fiebre del oro por los datos de entrenamiento de IA ha subido de marcha. 

Sí, las empresas de IA generativa siempre han necesitado grandes cantidades de datos, pero ahora se apresuran a pagar por ellos en lugar de obtenerlos gratuitamente. 

Hace sólo unos días, Reddit habría discutido a una empresa de inteligencia artificial aún por desvelar, un acuerdo que podría suponer unos $60 millones anuales. Todo esto surge mientras Reddit se prepara para una oferta pública de venta en marzo, con el objetivo de alcanzar una valoración cercana a los 1.400 millones de euros.

Este posible acuerdo de licencia se alinea con una tendencia creciente entre las empresas tecnológicas a asegurar acuerdos legítimos de uso de datos, especialmente ante los crecientes riesgos de los derechos de autor.

Las batallas legales en curso, como la Demanda contra el New York Timeshan aumentado la urgencia de contenidos tratos. 

El movimiento de Automattic para negociar con empresas de IA plantea dudas sobre el uso de contenidos generados por los usuarios para el entrenamiento de IA.

Al parecer, han anunciado planes para introducir una nueva función que permita a los usuarios optar por no compartir sus datos con terceros, incluidas las empresas de IA. 

Automattic hizo un declaración pública publicado a raíz del informe de 404, afirmando: "Actualmente bloqueamos, por defecto, los principales rastreadores de plataformas de IA -incluidos los de las mayores empresas tecnológicas- y actualizamos nuestras listas a medida que se lanzan otros nuevos", y "compartiremos únicamente el contenido público alojado en WordPress.com y Tumblr de los sitios que no hayan optado por la exclusión". 

Y continúa: "También estamos trabajando directamente con determinadas empresas de IA siempre que sus planes se ajusten a lo que preocupa a nuestra comunidad: atribución, exclusión y control."

Sin embargo, optar por que no se utilice su información para el entrenamiento de IA podría penalizar las cuentas de los usuarios.

En una nueva sección de preguntas frecuentes titulada "¿Qué ocurre si se opta por la exclusión?" se afirma: "Si se opta por la exclusión desde el principio, bloquearemos el acceso de los rastreadores a su contenido añadiendo su sitio a una lista de sitios no permitidos. Si cambia de opinión más adelante, también tenemos previsto actualizar a los socios sobre las personas que se hayan dado de baja por primera vez y solicitar que sus contenidos se eliminen de las fuentes anteriores y de futuras formaciones."

Vivimos en un mundo en el que cualquier cosa que publiques en Internet puede venderse para entrenar inteligencia artificial, si no es gratis.

Y a medida que evolucione la IA, es probable que se intensifique el debate sobre el uso de los datos y la privacidad.

Las empresas que poseen minas de oro de datos pueden ganar mucho, pero ¿a qué precio para el usuario medio de Internet?

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales