PIGEON AI-modell vet var du tog det där fotot

26 december 2023

Forskare från Stanford University har skapat AI-modeller som kan identifiera var ett foto togs med anmärkningsvärd noggrannhet. Det finns goda användningsområden för deras lösning, men viktiga etiska frågor måste också tas upp.

Om din semesterbild har Eiffeltornet eller Mount Rushmore bakom dig är det ganska lätt att säga var fotot togs. Om fotot togs på ett fält i Illinois med ett slumpmässigt träd bakom dig är det mycket mer utmanande att identifiera platsen.

Det är precis den typ av utmaning som mer än 50 miljoner spelare av GeoGuessr spelet njuta av.

Tre forskare från Stanford University var ivriga spelare av spelet och ville se hur AI-modeller skulle klara sig mot de bästa mänskliga spelarna.

De började med ett neuralt nätverk som heter CLIP, utvecklat av OpenAI, som bas för två olika modeller för geolokalisering av bilder.

Den första modellen, Predicting Image Geolocations (PIGEON), tränades med hjälp av ett dataset med cirka 100 000 platser från GeoGuessr-spelet. För varje plats försågs PIGEON med ett 360-graders panorama som skapats av en uppsättning av fyra Google Street View-bilder.

Den andra modellen, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), tränades uteslutande på mer än 4 miljoner geotaggade Flickr-bilder från hela världen.

När PIGEON presenterades med en Google Street View-bild av någonstans i världen kunde han gissa landet korrekt 95% av gångerna och kunde välja platsen inom cirka 16 miles drygt 40% av gångerna.

Forskarna ställde sedan PIGEON mot de bästa GeoGuessr-spelarna och slog dem med en betydande marginal.

PIGEON:s fel i geolokaliseringsavståndet jämfört med mänskliga GeoGuessr-spelare med olika skicklighetsnivåer i spelet i 458 matcher med flera omgångar. Champion Division består av de bästa 0,01% av spelarna. Källa: arXiv

PIGEOTTO, som är en mer generaliserad modell, slog de nuvarande toppmoderna modellerna med stor marginal på referensdataset för geolokalisering.

När PIGEON ställdes mot Trevor Rainbolt, som anses vara en av de bästa geoguessarna i världen, slog den honom flera gånger. Det påminner lite om när Deep Blue slog Gary Kasparov i schack 1997.

Etiska överväganden

Nyttan med dessa modeller är större än möjligheten att fuska med GeoGuessr. Tidningen konstaterade att modellerna skulle kunna användas inom "autonom körning, navigering, geografiutbildning, underrättelseverksamhet med öppen källkod och visuella undersökningar inom journalistik".

I takt med att dessa modeller oundvikligen blir mer exakta blir integritetsfrågorna alltmer angelägna. Förutom att identifiera var du befinner dig, är andra integritetsfrågor att vissa modeller kan härleda lokala inkomst-, rasoch utbildningsmönster samt röstningsmönster från geolokaliseringsdata för bilder.

Det finns också ett stort intresse från försvarsindustrin i vad dessa modeller kan göra. Forskarna vid Stanford University säger: "Såvitt vi vet är detta den första toppmoderna artikeln om geolokalisering av bilder under de senaste fem åren som inte finansieras av militära kontrakt."

Precis som med mycket AI-teknik väcker riskerna med dubbla användningsområden i samband med dessa modeller etiska frågor som måste hanteras på något sätt.

När företag som Meta tränar sina modeller på dina Instagram-bilder är det värt att komma ihåg att dina selfies avslöjar mer för AI än du tror.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar