Elon Musk har midlertidig begrenset antall tweets brukerne kan se i løpet av en dag. Dette beskrives som et "midlertidig nødtiltak".
I sin egen tweet delte Musk at ubekreftede kontoer nå har en grense på å lese 1 000 innlegg per dag. Nye ubekreftede kontoer har en grense på 500 innlegg, mens de med "verifisert" status for øyeblikket er begrenset til å se 10 000 innlegg per dag.
Opprinnelig hadde Musk innført strengere grenser, men reviderte dem i løpet av få timer etter kunngjøringen.
For å håndtere ekstreme nivåer av dataskraping og systemmanipulasjon har vi innført følgende midlertidige begrensninger:
- Verifiserte kontoer er begrenset til å lese 6000 innlegg/dag
- Ubekreftede kontoer til 600 innlegg/dag
- Nye ubekreftede kontoer til 300/dag- Elon Musk (@elonmusk) 1. juli 2023
Musk uttalte at disse midlertidige restriksjonene var et svar på "ekstreme nivåer av dataskraping og systemmanipulasjon".
Han bemerket på fredag: "Vi ble plyndret så mye at det forringet tjenesten for vanlige brukere", etter at brukerne så skjermbilder der de ble bedt om å logge inn for å se Twitter-innhold.
Musk satte opprinnelig lesegrenser på 6000 innlegg per dag for bekreftede kontoer, 600 for ubekreftede kontoer og 300 for nye ubekreftede kontoer. I en senere oppdatering uttalte Musk at "flere hundre organisasjoner, kanskje flere, skrapte Twitter-data ekstremt aggressivt".
Dataskraping er uthenting av informasjon fra internett.
For å kunne bygge komplekse, store språkmodeller (LLM) trenger AI-selskaper data fra ekte menneskelige samtaler ogHvor er det bedre å lete etter disse dataene enn på internett? For å samle inn slike data gjennomsøker roboter utrettelig nettsteder som Twitter og trekker ut tekstdata.
Men selv om disse dataene er tilgjengelige for allmennheten, er mye av dem ikke gratis. Plattformer som Twitter og Reddit vil ha betalt for dataene sine.
Dessuten belaster dataskrapende roboter serverne. Musk, som er kritisk til AI, sa: "Det er ganske irriterende å måtte ta et stort antall servere i bruk i nødstilfeller bare for å legge til rette for en eller annen AI-startups vanvittige verdivurdering."
I april sa Steve Huffman, Reddits administrerende direktør, fortalte New York Times"Reddits datamateriale er veldig verdifullt, men vi trenger ikke å gi all denne verdien gratis til noen av de største selskapene i verden."
Twitter har allerede begynt å ta betalt for tilgang til programmeringsgrensesnittet (API), som ofte brukes av tredjepartsapper og forskere, inkludert AI-selskaper.
Men hvem sine data er det egentlig?
Det foregår en form for digital geriljakrigføring på serverne til nettsteder som Reddit og Twitter.
Dataskrapere utvinner data på internett for å drive AI-modeller, selv om dataene ikke er ment å brukes på en slik måte.
Reddit, Twitter osv. er i sin fulle rett til å slå ned på crawling av data, men det er ingen enkel oppgave.
Skraping er i strid med disse nettstedenes tjenestevilkår, men sannsynligvis ikke ulovlig - selv om det avhenger av hva du bruker dataene til.
I bunn og grunn er dataskraping en form for digitalt eiendomskrenkelse. Du er fortsatt på noens eiendom selv om du ikke gjør noe ulovlig.
Twitter ser ut til å utvikle nye teknikker for å begrense dataskraping, noe som absolutt gir mening med tanke på Musks generelle kritikk av AI-industrien og noen av dens nøkkelaktører.