Forskere fra Stanford University har skabt AI-modeller, der kan identificere, hvor et foto er taget, med bemærkelsesværdig nøjagtighed. Der er gode anvendelsesmuligheder for deres løsning, men der skal også tages stilling til vigtige etiske spørgsmål.
Hvis dit feriebillede har Eiffeltårnet eller Mount Rushmore bag dig, så er det ret nemt at se, hvor billedet er taget. Hvis billedet er taget på en mark i Illinois med et tilfældigt træ bag dig, er det meget mere udfordrende at identificere stedet.
Det er netop den slags udfordring, som mere end 50 millioner spillere af GeoGuessr spil nyde.
Tre forskere fra Stanford University var ivrige spillere af spillet og ville se, hvordan AI-modeller ville klare sig mod de bedste menneskelige spillere.
De startede med et neuralt netværk kaldet CLIP, udviklet af OpenAI, som base for to forskellige modeller til geolokalisering af billeder.
Den første model, Predicting Image Geolocations (PIGEON), blev trænet ved hjælp af et datasæt med omkring 100.000 steder fra GeoGuessr-spillet. For hver placering fik PIGEON et 360-graders panorama lavet ud fra et sæt af fire Google Street View-billeder.
Den anden model, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), blev udelukkende trænet på mere end 4 millioner geo-taggede Flickr-billeder fra hele verden.
Når PIGEON blev præsenteret for et Google Street View-billede af et hvilket som helst sted i verden, var den i stand til at gætte landet korrekt i 95% af tilfældene og kunne vælge stedet inden for en afstand af ca. 16 km i lidt over 40% af tilfældene.
Forskerne satte derefter PIGEON op mod de bedste GeoGuessr-spillere, hvor den slog dem med en betydelig margin.
PIGEOTTO, som er en mere generaliseret model, slog de nuværende state-of-the-art-modeller på geolokaliserings-benchmarkdatasæt med en stor margin.
Da PIGEON mødte Trevor Rainbolt, som anses for at være en af de bedste geoguessere i verden, slog den ham flere gange. Det minder lidt om Deep Blue, der slog Gary Kasparov i skak tilbage i 1997.
Vi byggede en AI til at konkurrere mod verdens bedste GeoGuessr-spiller og vandt! 🔎🌍🏆
I @geoguessr>50 millioner spillere konkurrerer om at gætte, hvor de er, ud fra en tilfældig placering på Google Street View. 🗺️
Tak for hjælpen @georainbolt for den sjove udfordring!https://t.co/g7tIeUELz5
- Lukas Haas (@lkshaas) 13. maj 2023
Etiske overvejelser
Nytten af disse modeller går ud over muligheden for at snyde i GeoGuessr. Avisen bemærkede, at modellerne kunne bruges til "autonom kørsel, navigation, geografiundervisning, open source-intelligens og visuelle undersøgelser inden for journalistik."
Efterhånden som disse modeller uundgåeligt bliver mere nøjagtige, bliver spørgsmål om privatlivets fred et større problem. Ud over at identificere din placering omfatter andre problemer med privatlivets fred nogle modellers evne til at udlede lokal indkomst, race, uddannelse og stemmemønstre fra billedgeolokaliseringsdata.
Der er også stor interesse fra Forsvarsindustrien i, hvad disse modeller kan gøre. Forskerne fra Stanford University sagde: "Så vidt vi ved, er dette den første state-of-the-art artikel om billedgeolokalisering inden for de sidste fem år, som ikke er finansieret af militære kontrakter."
Som det er tilfældet med meget AI-teknologi, giver risikoen for dobbelt anvendelse i forbindelse med disse modeller anledning til etiske bekymringer, som skal håndteres på en eller anden måde.
Når firmaer som Meta træner deres modeller på dine Instagram-billeder, er det værd at huske på, at dine selfies afslører mere for AI, end du tror.