Elon Musk begränsar hur många tweets användarna kan se för att hindra dataskrapning

3 juli 2023

AI twitter

Elon Musk har tillfälligt begränsat antalet tweets som användare kan se under en dag. Detta beskrivs som en "tillfällig nödåtgärd".

I sin egen tweet delade Musk att overifierade konton nu har en gräns på att läsa 1 000 inlägg per dag. Nya overifierade konton har en gräns på 500 inlägg, medan de med "verifierad" status för närvarande är begränsade till att visa 10 000 inlägg per dag.

Musk hade ursprungligen infört strängare gränser men reviderade dem inom några timmar efter tillkännagivandet.

Musk sade att dessa tillfälliga restriktioner var ett svar på "extrema nivåer av dataskrapning och systemmanipulation".

Han konstaterade på fredagen att "vi fick så mycket data att det försämrade servicen för vanliga användare", efter att användare sett skärmar som bad dem logga in för att se Twitter-innehåll. 

Musk satte ursprungligen läsgränser på 6 000 inlägg per dag för verifierade konton, 600 för overifierade konton och 300 för nya overifierade konton. I en efterföljande uppdatering uppgav Musk att "flera hundra organisationer, kanske fler, skrapade Twitter-data extremt aggressivt." 

Data scraping innebär att man hämtar information från internet.

För att kunna bygga komplexa stora språkmodeller (LLM) behöver AI-företagen data från verkliga mänskliga konversationer ochVar kan man då leta efter dessa data bättre än på internet? För att samla in sådan data genomsöker botar outtröttligt webbplatser som Twitter och extraherar textdata. 

Men även om dessa data är tillgängliga för allmänheten är mycket av dem inte gratis. Plattformar som Twitter och Reddit vill ha betalt för sina data. 

Dessutom belastar dataskrapningsrobotar servrar. Musk, som är kritisk till AI, sa: "Det är ganska irriterande att behöva ta ett stort antal servrar online på nödbasis bara för att underlätta någon AI-startups upprörande värdering."

På liknande sätt, i april, Steve Huffman, Reddits VD, berättade för New York Times"Reddits datakorpus är verkligen värdefull, men vi behöver inte ge allt detta värde gratis till några av de största företagen i världen."

Twitter har redan börjat ta betalt av användare för tillgång till sitt API (Application Programming Interface), som ofta används av tredjepartsappar och forskare, inklusive AI-företag.

Men vems data är det egentligen?

Det pågår en form av digital gerillakrigföring på de servrar som är värdar för webbplatser som Reddit och Twitter.

Dataskrapare gör intensiva datauttag på internet för att driva AI-modeller, även när dessa data inte är avsedda att användas på ett sådant sätt. 

Reddit, Twitter, etc., är helt inom sina rättigheter att slå ner på datakrypning, men det är ingen lätt uppgift. 

Skrapning strider mot dessa webbplatsers användarvillkor men är förmodligen inte olagligt - men det beror på vad du använder uppgifterna till.

I grund och botten är dataskrapning en form av digitalt intrång. Du är fortfarande på någons egendom även om du inte gör något olagligt. 

Twitter verkar utveckla nya tekniker för att begränsa dataskrapning, vilket verkligen är meningsfullt med tanke på Musks allmänna kritik av AI-industrin och några av dess nyckelaktörer.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar