Elon Musk limita el número de tuits que pueden ver los usuarios para frenar el robo de datos

3 de julio de 2023

AI twitter

Elon Musk ha restringido temporalmente el número de tuits que los usuarios pueden ver en un día. Esto se describe como una "medida de emergencia temporal".

En su propio tuit, Musk compartió que las cuentas no verificadas tienen ahora un límite de lectura de 1.000 publicaciones al día. Las nuevas cuentas no verificadas tienen un límite de 500 publicaciones, mientras que las que tienen el estatus de "verificadas" no pueden ver más de 10.000 publicaciones al día.

Inicialmente, Musk había impuesto límites más estrictos, pero los revisó a las pocas horas del anuncio.

Musk declaró que estas restricciones temporales respondían a "niveles extremos de rastreo de datos y manipulación del sistema".

El viernes señaló: "Nos estaban saqueando tanto los datos que estaba degradando el servicio para los usuarios normales", después de que los usuarios vieran pantallas en las que se les pedía que iniciaran sesión para ver el contenido de Twitter. 

Musk fijó inicialmente límites de lectura de 6.000 publicaciones al día para cuentas verificadas, 600 para cuentas no verificadas y 300 para nuevas cuentas no verificadas. En una actualización posterior, Musk declaró que "varios cientos de organizaciones, quizá más, estaban raspando datos de Twitter de forma extremadamente agresiva." 

El raspado de datos es la extracción de información de Internet.

Para construir grandes modelos lingüísticos (LLM) complejos, las empresas de IA necesitan datos de conversaciones humanas reales y w¿Qué mejor lugar para buscar esos datos que Internet? Para recopilar esos datos, los bots rastrean incansablemente sitios como Twitter y extraen datos de texto. 

Sin embargo, aunque están a disposición del público, muchos de estos datos no están ahí para ser utilizados. Plataformas como Twitter y Reddit quieren cobrar por sus datos. 

Además, los bots de extracción de datos sobrecargan los servidores. Musk, que se muestra crítico con la IA, dijo: "Es bastante irritante tener que poner en línea de emergencia un gran número de servidores solo para facilitar la escandalosa valoración de alguna startup de IA."

Del mismo modo, en abril, Steve Huffman, CEO de Reddit, al New York Times"El corpus de datos de Reddit es realmente valioso, pero no tenemos por qué dar todo ese valor a algunas de las mayores empresas del mundo de forma gratuita".

Twitter ya ha empezado a cobrar a los usuarios por el acceso a su interfaz de programación de aplicaciones (API), utilizada a menudo por aplicaciones de terceros e investigadores, incluidas empresas de IA.

Pero, ¿de quién son los datos?

Existe una forma de guerra de guerrillas digital en los servidores que alojan sitios como Reddit y Twitter.

Los raspadores de datos están minando Internet de forma intensiva para alimentar modelos de IA, incluso cuando esos datos no están destinados a ser utilizados de esa forma. 

Reddit, Twitter, etc., están en su perfecto derecho de tomar medidas enérgicas contra el rastreo de datos, pero no es tarea fácil. 

El "scraping" va en contra de las condiciones de servicio de estos sitios, pero probablemente no sea ilegal, aunque depende de para qué se utilicen los datos.

En esencia, el raspado de datos es una forma de intrusión digital. Sigues estando en la propiedad de alguien aunque no estés haciendo nada ilegal. 

Twitter parece estar desarrollando técnicas novedosas para frenar el scraping de datos, lo que sin duda tiene sentido dadas las críticas generales de Musk a la industria de la IA y a algunos de sus actores clave.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales