PIGEON AI-modellen vet hvor du tok bildet

26. desember 2023

Forskere fra Stanford University har laget AI-modeller som kan identifisere hvor et bilde er tatt med bemerkelsesverdig nøyaktighet. Det finnes gode bruksområder for løsningen, men det er også viktige etiske hensyn som må tas.

Hvis feriebildet ditt har Eiffeltårnet eller Mount Rushmore bak deg, er det ganske enkelt å si hvor bildet ble tatt. Hvis bildet er tatt på et jorde i Illinois med et tilfeldig tre bak deg, er det mye mer utfordrende å identifisere stedet.

Det er akkurat den typen utfordring som mer enn 50 millioner spillere av GeoGuessr spillet nyte.

Tre forskere fra Stanford University var ivrige spillere av spillet og ønsket å se hvordan AI-modeller ville klare seg mot de beste menneskelige spillerne.

De startet med et nevralt nettverk kalt CLIP, utviklet av OpenAI, som utgangspunkt for to ulike modeller for geolokalisering av bilder.

Den første modellen, Predicting Image Geolocations (PIGEON), ble trent opp ved hjelp av et datasett med rundt 100 000 steder fra GeoGuessr-spillet. For hvert sted fikk PIGEON et 360-graders panorama laget av et sett med fire Google Street View-bilder.

Den andre modellen, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), ble trent utelukkende på mer enn 4 millioner geo-taggede Flickr-bilder fra hele verden.

Når PIGEON ble presentert for et Google Street View-bilde av et hvilket som helst sted i verden, klarte PIGEON å gjette landet riktig i 95% av tilfellene, og i litt over 40% av tilfellene klarte han å finne stedet innenfor en radius på ca. 16 miles.

Forskerne satte deretter PIGEON opp mot de beste GeoGuessr-spillerne, og PIGEON slo dem med betydelig margin.

PIGEONs geolokaliseringsavstandsfeil mot menneskelige GeoGuessr-spillere på ulike ferdighetsnivåer i 458 kamper med flere runder. Mesterdivisjonen består av de beste 0,01% av spillerne. Kilde: arXiv

PIGEOTTO, som er en mer generalisert modell, slo de nåværende toppmodellene på geolokaliseringsreferansedatasett med stor margin.

Da PIGEON møtte Trevor Rainbolt, som regnes som en av de beste geoguesserne som finnes, slo den ham flere ganger. Det minner litt om da Deep Blue slo Gary Kasparov i sjakk i 1997.

Etiske overveielser

Nytten av disse modellene går langt utover potensialet for juks på GeoGuessr. Avisen bemerket at modellene kan brukes i "autonom kjøring, navigasjon, geografiundervisning, etterretning med åpen kildekode og visuelle undersøkelser i journalistikk".

Etter hvert som disse modellene blir stadig mer nøyaktige, blir personvernspørsmål et større problem. I tillegg til å identifisere hvor du befinner deg, er det også andre personvernproblemer knyttet til at enkelte modeller kan utlede lokale inntekts-, rase-, utdannings- og stemmemønstre fra geolokaliseringsdata fra bilder.

Det er også stor interesse fra forsvarsindustrien i hva disse modellene kan gjøre. Forskerne fra Stanford University sier: "Så vidt vi vet, er dette den første artikkelen om geolokalisering av bilder de siste fem årene som ikke er finansiert av militære kontrakter."

Som med mye annen AI-teknologi, reiser risikoen for dobbeltbruk knyttet til disse modellene etiske problemstillinger som må håndteres på en eller annen måte.

Når slike som Meta trener modellene sine på Instagram-bildene dine, er det verdt å huske på at selfiene dine avslører mer for AI enn du tror.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser