Elon Musk har tillfälligt begränsat antalet tweets som användare kan se under en dag. Detta beskrivs som en "tillfällig nödåtgärd".
I sin egen tweet delade Musk att overifierade konton nu har en gräns på att läsa 1 000 inlägg per dag. Nya overifierade konton har en gräns på 500 inlägg, medan de med "verifierad" status för närvarande är begränsade till att visa 10 000 inlägg per dag.
Musk hade ursprungligen infört strängare gränser men reviderade dem inom några timmar efter tillkännagivandet.
För att hantera extrema nivåer av dataskrapning och systemmanipulation har vi infört följande tillfälliga begränsningar:
- Verifierade konton är begränsade till att läsa 6000 inlägg/dag
- Overifierade konton till 600 inlägg/dag
- Nya obekräftade konton till 300/dag- Elon Musk (@elonmusk) 1 juli 2023
Musk sade att dessa tillfälliga restriktioner var ett svar på "extrema nivåer av dataskrapning och systemmanipulation".
Han konstaterade på fredagen att "vi fick så mycket data att det försämrade servicen för vanliga användare", efter att användare sett skärmar som bad dem logga in för att se Twitter-innehåll.
Musk satte ursprungligen läsgränser på 6 000 inlägg per dag för verifierade konton, 600 för overifierade konton och 300 för nya overifierade konton. I en efterföljande uppdatering uppgav Musk att "flera hundra organisationer, kanske fler, skrapade Twitter-data extremt aggressivt."
Data scraping innebär att man hämtar information från internet.
För att kunna bygga komplexa stora språkmodeller (LLM) behöver AI-företagen data från verkliga mänskliga konversationer ochVar kan man då leta efter dessa data bättre än på internet? För att samla in sådan data genomsöker botar outtröttligt webbplatser som Twitter och extraherar textdata.
Men även om dessa data är tillgängliga för allmänheten är mycket av dem inte gratis. Plattformar som Twitter och Reddit vill ha betalt för sina data.
Dessutom belastar dataskrapningsrobotar servrar. Musk, som är kritisk till AI, sa: "Det är ganska irriterande att behöva ta ett stort antal servrar online på nödbasis bara för att underlätta någon AI-startups upprörande värdering."
På liknande sätt, i april, Steve Huffman, Reddits VD, berättade för New York Times"Reddits datakorpus är verkligen värdefull, men vi behöver inte ge allt detta värde gratis till några av de största företagen i världen."
Twitter har redan börjat ta betalt av användare för tillgång till sitt API (Application Programming Interface), som ofta används av tredjepartsappar och forskare, inklusive AI-företag.
Men vems data är det egentligen?
Det pågår en form av digital gerillakrigföring på de servrar som är värdar för webbplatser som Reddit och Twitter.
Dataskrapare gör intensiva datauttag på internet för att driva AI-modeller, även när dessa data inte är avsedda att användas på ett sådant sätt.
Reddit, Twitter, etc., är helt inom sina rättigheter att slå ner på datakrypning, men det är ingen lätt uppgift.
Skrapning strider mot dessa webbplatsers användarvillkor men är förmodligen inte olagligt - men det beror på vad du använder uppgifterna till.
I grund och botten är dataskrapning en form av digitalt intrång. Du är fortfarande på någons egendom även om du inte gör något olagligt.
Twitter verkar utveckla nya tekniker för att begränsa dataskrapning, vilket verkligen är meningsfullt med tanke på Musks allmänna kritik av AI-industrin och några av dess nyckelaktörer.