Onderzoekers van Stanford University creëerden AI-modellen die met opmerkelijke nauwkeurigheid kunnen identificeren waar een foto is genomen. Er zijn goede gebruiksmogelijkheden voor hun oplossing, maar er zullen ook belangrijke ethische kwesties moeten worden aangepakt.
Als je vakantiefoto de Eiffeltoren of Mount Rushmore achter je heeft, is het vrij eenvoudig om te vertellen waar de foto is genomen. Als de foto is genomen in een veld in Illinois met een willekeurige boom achter je, dan is het een stuk lastiger om de locatie te bepalen.
Dat is precies het soort uitdaging dat meer dan 50 miljoen spelers van de GeoGuessr spelplezier.
Drie onderzoekers van Stanford University waren fervente spelers van het spel en wilden zien hoe AI-modellen het zouden doen tegen de beste menselijke spelers.
Ze begonnen met een neuraal netwerk genaamd CLIP, ontwikkeld door OpenAI, als basis voor twee verschillende beeldgeolokalisatiemodellen.
Het eerste model, Predicting Image Geolocations (PIGEON), werd getraind met behulp van een dataset van ongeveer 100.000 locaties uit het spel GeoGuessr. Voor elke locatie werd PIGEON voorzien van een 360-graden panorama gemaakt van een set van vier Google Street View-beelden.
Het tweede model, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), werd uitsluitend getraind op meer dan 4 miljoen Flickr-afbeeldingen met geotags van over de hele wereld.
Wanneer een Google Street View-afbeelding van waar dan ook ter wereld werd getoond, kon PIGEON in 95% van de tijd het land correct raden en in iets meer dan 40% van de tijd de locatie binnen ongeveer 16 mijl kiezen.
De onderzoekers stelden PIGEON vervolgens op tegen de beste GeoGuessr-spelers en versloegen hen met een aanzienlijke marge.
PIGEOTTO, dat een algemener model is, versloeg de huidige geavanceerde modellen op benchmarkdatasets voor geolokalisatie met een grote marge.
Toen PIGEON het opnam tegen Trevor Rainbolt, die als een van de beste geoguessers wordt beschouwd, versloeg het hem meerdere keren. Het doet een beetje denken aan Deep Blue die Gary Kasparov versloeg met schaken in 1997.
We hebben een AI gebouwd om het op te nemen tegen de beste GeoGuessr-speler ter wereld en we hebben gewonnen! 🔎🌍🏆
In @geoguessr>50 miljoen spelers strijden om te raden waar ze zijn op basis van willekeurige locaties op Google Street View. 🗺️
Bedankt @georainbolt voor de leuke uitdaging!https://t.co/g7tIeUELz5
- Lukas Haas (@lkshaas) 13 mei 2023
Ethische overwegingen
Het nut van deze modellen gaat verder dan de mogelijkheid om vals te spelen bij GeoGuessr. Het papier merkte op dat de modellen gebruikt zouden kunnen worden in "autonoom rijden, navigatie, aardrijkskundeonderwijs, open-source intelligentie en visueel onderzoek in de journalistiek".
Naarmate deze modellen nauwkeuriger worden, worden privacykwesties steeds belangrijker. Naast het identificeren van je locatie, zijn er andere privacykwesties, zoals de mogelijkheid van sommige modellen om lokaal inkomen, ras, opleiding en stempatronen af te leiden uit de geolokalisatiegegevens van afbeeldingen.
Er is ook veel belangstelling van de defensie-industrie in wat deze modellen kunnen doen. De onderzoekers van Stanford University zeiden: "Voor zover wij weten, is dit het eerste artikel over geavanceerde beeldgeolokalisatie in de afgelopen vijf jaar dat niet is gefinancierd door militaire contracten."
Zoals met veel AI-technologie het geval is, leiden de risico's van tweeërlei gebruik van deze modellen tot ethische bezwaren die op de een of andere manier moeten worden beheerst.
Nu Meta zijn modellen traint op jouw Instagram-foto's, is het de moeite waard om te onthouden dat je selfies meer onthullen aan AI dan je denkt.