Forskere fra Stanford University har laget AI-modeller som kan identifisere hvor et bilde er tatt med bemerkelsesverdig nøyaktighet. Det finnes gode bruksområder for løsningen, men det er også viktige etiske hensyn som må tas.
Hvis feriebildet ditt har Eiffeltårnet eller Mount Rushmore bak deg, er det ganske enkelt å si hvor bildet ble tatt. Hvis bildet er tatt på et jorde i Illinois med et tilfeldig tre bak deg, er det mye mer utfordrende å identifisere stedet.
Det er akkurat den typen utfordring som mer enn 50 millioner spillere av GeoGuessr spillet nyte.
Tre forskere fra Stanford University var ivrige spillere av spillet og ønsket å se hvordan AI-modeller ville klare seg mot de beste menneskelige spillerne.
De startet med et nevralt nettverk kalt CLIP, utviklet av OpenAI, som utgangspunkt for to ulike modeller for geolokalisering av bilder.
Den første modellen, Predicting Image Geolocations (PIGEON), ble trent opp ved hjelp av et datasett med rundt 100 000 steder fra GeoGuessr-spillet. For hvert sted fikk PIGEON et 360-graders panorama laget av et sett med fire Google Street View-bilder.
Den andre modellen, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), ble trent utelukkende på mer enn 4 millioner geo-taggede Flickr-bilder fra hele verden.
Når PIGEON ble presentert for et Google Street View-bilde av et hvilket som helst sted i verden, klarte PIGEON å gjette landet riktig i 95% av tilfellene, og i litt over 40% av tilfellene klarte han å finne stedet innenfor en radius på ca. 16 miles.
Forskerne satte deretter PIGEON opp mot de beste GeoGuessr-spillerne, og PIGEON slo dem med betydelig margin.
PIGEOTTO, som er en mer generalisert modell, slo de nåværende toppmodellene på geolokaliseringsreferansedatasett med stor margin.
Da PIGEON møtte Trevor Rainbolt, som regnes som en av de beste geoguesserne som finnes, slo den ham flere ganger. Det minner litt om da Deep Blue slo Gary Kasparov i sjakk i 1997.
Vi bygget en AI for å konkurrere mot verdens beste GeoGuessr-spiller og vant! 🔎🌍🏆
I @geoguessr>50 millioner spillere konkurrerer om å gjette hvor de befinner seg basert på tilfeldige steder på Google Street View. 🗺️
Takk @georainbolt for den morsomme utfordringen!https://t.co/g7tIeUELz5
- Lukas Haas (@lkshaas) 13. mai 2023
Etiske overveielser
Nytten av disse modellene går langt utover potensialet for juks på GeoGuessr. Avisen bemerket at modellene kan brukes i "autonom kjøring, navigasjon, geografiundervisning, etterretning med åpen kildekode og visuelle undersøkelser i journalistikk".
Etter hvert som disse modellene blir stadig mer nøyaktige, blir personvernspørsmål et større problem. I tillegg til å identifisere hvor du befinner deg, er det også andre personvernproblemer knyttet til at enkelte modeller kan utlede lokale inntekts-, rase-, utdannings- og stemmemønstre fra geolokaliseringsdata fra bilder.
Det er også stor interesse fra forsvarsindustrien i hva disse modellene kan gjøre. Forskerne fra Stanford University sier: "Så vidt vi vet, er dette den første artikkelen om geolokalisering av bilder de siste fem årene som ikke er finansiert av militære kontrakter."
Som med mye annen AI-teknologi, reiser risikoen for dobbeltbruk knyttet til disse modellene etiske problemstillinger som må håndteres på en eller annen måte.
Når slike som Meta trener modellene sine på Instagram-bildene dine, er det verdt å huske på at selfiene dine avslører mer for AI enn du tror.