Google bruger alt, hvad du poster online, til at træne sin AI

6. juli 2023

Googles opdatering af privatlivsvilkår for AI-data

Google siger, at alle offentligt tilgængelige data på internettet er lovlige at skrabe og bruge til at træne sine AI-produkter.

Googles opdateret privatlivspolitik står der nu, at "Google bruger oplysninger til at forbedre vores tjenester og til at udvikle nye produkter, funktioner og teknologier til gavn for vores brugere og offentligheden." Der står videre, at de bruger offentligt tilgængelige oplysninger til at "hjælpe med at træne Googles AI-modeller og opbygge produkter og funktioner som Google Translate, Bard og Cloud AI-funktioner." 

Den tidligere version af politikken henviste til, at Google brugte data til at træne "sprogmodeller", mens den nu henviser til "AI-modeller", hvilket udvider anvendelsesområdet.

Den løse definition af "information" og de udvidede mål for træning ved hjælp af disse data synes at indikere, at hvis du lægger noget ud på nettet, kan du forvente, at Google scraper det og tilføjer det til sine træningsdata.

Vi forstår, at hvis vi skriver en kommentar på Facebook, tweeter noget eller skriver en anmeldelse på Amazon, så er det tilgængeligt for offentligheden. Man forventer ikke, at det er privat. Men er du tryg ved, at dine ord bliver brugt til at træne en AI-model?

Ændringen i politikformuleringen kan også være et signal om, at Google har til hensigt at øge sin scraping-indsats. Og det tempo, hvormed Google og andre AI-virksomheder scraper offentligt tilgængelige data, har ødelæggende konsekvenser for mange platforme.

Twitter begrænsede for nylig adgangen til sine tjenester, da serverne kæmpede for at holde trit med "ekstreme niveauer af datascraping og systemmanipulation", ifølge Elon Musk. Twitter fjernede også den gratis adgang til sin API i et forsøg på at dæmme op for scrapere og ødelagde derfor en masse tredjepartstjenester, der er afhængige af API'en.

Reddit er heller ikke gået ram forbi i denne jagt på data. De fjernede også den gratis adgang til Reddit API'en, til dels på grund af udnyttelse af scrapere. Den efterfølgende modreaktion fra de Reddit-moderatorer, der bruger API'en, har effektivt lukket dele af internettet ned.

Hundredvis af de største subreddits blev gjort private eller usynlige af Protesterende subreddit-moderatorer. Reddits ejere stiller ikke så subtile ultimatummer til moderatorerne om at åbne subreddits igen, men protesten fortsætter.

Det ironiske er, at Google også lider som følge heraf. At tilføje "Reddit" til en Google-søgeforespørgsel er blevet en populær måde at få meget specifikke resultater for en forespørgsel. Reddit-blackouten har gjort mange af disse søgeresultater utilgængelige nu.

De fleste platforme har servicevilkår, der forbyder datascraping, men at bryde servicevilkårene er ikke nødvendigvis ensbetydende med at bryde loven. Mens de prøver at finde en løsning, skal du sikre dig, at du er indforstået med, at Google og andre bruger dine data til at træne deres AI-modeller, før du lægger noget ud på nettet.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser