Reddit está actualmente bajo la lupa de la Comisión Federal de Comercio (FTC) por sus prácticas de concesión de licencias de datos de IA, que se revelaron antes de una prevista salida a bolsa.
La investigación de la FTC se centra en que Reddit "vende, licencia o comparte contenido generado por los usuarios con terceros para entrenar modelos de IA."
Se produce cuando Reddit se prepara para salir a bolsa, con planes para fijar el precio de sus acciones entre $31 y $34, valorando potencialmente la empresa en aproximadamente $6.500 millones.
Reddit se encuentra ante una de las mayores minas de oro de la historia de Internet. Su intención de vender entradas y comentarios ha provocado un intenso debate entre sus 850 millones de usuarios mensuales.
Un post de Reddit se titula "Desde que Reddit está vendiendo datos de usuarios oficialmente ahora, ¿están tus historias a salvo?" con respuestas acordando "empezar a verter datos basura inútiles en Reddit todos los días durante los próximos sesenta días."
Es un punto interesante: los datos de Reddit son muy sensibles a las aportaciones de los usuarios y, con comunidades tan fuertes, la empresa no debería ser demasiado complaciente sobre su derecho a los contenidos generados por los usuarios.
No obstante, Reddit argumenta que la venta de datos se mantiene en armonía con sus principios: "La oportunidad no entra en conflicto con nuestros valores y los derechos de nuestros Redditors".
Las perspectivas financieras de Reddit parecen sólidas, con un aumento de los ingresos de 20% el año pasado, que ascendieron a $804 millones, impulsados en gran medida por la publicidad.
Hasta el momento, la revelación de Reddit incluye la celebración de acuerdos de licencia de datos valorados en $203 millones. Espera generar al menos $66,4 millones de estos acuerdos en 2024. Es una parte modesta de su flujo total de ingresos, pero podría crecer exponencialmente.
Reddit ya se ha asociado con Google para entrenar modelos de inteligencia artificial, entre otros objetivos. Esto pone de relieve la importancia de sus datos en un mundo en el que las empresas tecnológicas están cada vez más dispuestas a pagar por sus datos en lugar de limitarse a extraerlos de dudosas fuentes de "uso público".
En respuesta a los comentarios de la FTC, Reddit declaróNo nos sorprende que la FTC se haya interesado" por sus prácticas de concesión de licencias de datos, atribuyendo el escrutinio a "la naturaleza novedosa de estas tecnologías y acuerdos comerciales".
Además, Reddit afirma creer en la legalidad de sus prácticas y subraya: "No creemos haber incurrido en ninguna práctica comercial desleal o engañosa."
La empresa también compartió información sobre el diálogo en curso con la FTC, señalando: "La carta indicaba que el personal de la FTC estaba interesado en reunirse con nosotros para conocer mejor nuestros planes y que la FTC tenía la intención de solicitarnos información y documentos a medida que prosiguiera su investigación."
En los últimos tiempos, la FTC ha adoptado una línea más dura en relación con los acuerdos tecnológicos. nuevos poderes de investigación sobre las empresas de IA el pasado noviembre.
La nueva fiebre del oro de los datos de pago
Los datos han salido baratos a las empresas de IA generativa, ya que las bases de datos creadas por entidades web como Common Crawl y LAION constituyen el pilar de los datos de entrenamiento.
Sin embargo, eso está cambiando, con las demandas por derechos de autor acumulándose y la Ley de AI de la UE intentar imponer prácticas de datos más estrictas para la industria.
Además, muchos sitios web bloqueando activamente Rastreadores web de IA. La era del salvaje oeste de los datos de entrenamiento gratuitos podría estar llegando a su fin.
Reddit no es la única empresa que conoce el valor de sus contenidos. Automattic, la empresa matriz de WordPress y Tumblr, es supuestamente en conversaciones con MidJourney y OpenAI para un acuerdo de contenidos y datos.
Mientras Reddit se prepara para su salida a bolsa, la trayectoria de la empresa será observada de cerca tanto por los reguladores como por los Redditors.