Il modello PIGEON AI sa dove hai scattato quella foto

26 dicembre 2023

I ricercatori dell'Università di Stanford hanno creato modelli di intelligenza artificiale in grado di identificare il luogo in cui è stata scattata una foto con notevole precisione. I casi d'uso per la loro soluzione sono buoni, ma dovranno essere affrontate anche importanti questioni etiche.

Se lo scatto delle vacanze ha alle spalle la Torre Eiffel o il Monte Rushmore, allora è abbastanza facile capire dove è stata scattata la foto. Se invece la foto è stata scattata in un campo dell'Illinois con un albero a caso alle spalle, è molto più difficile identificare il luogo.

Questo è proprio il tipo di sfida che più di 50 milioni di giocatori di GeoGuessr gioco godere.

Tre ricercatori dell'Università di Stanford erano accaniti giocatori di questo gioco e volevano vedere come i modelli di intelligenza artificiale avrebbero affrontato i migliori giocatori umani.

Hanno iniziato con una rete neurale chiamata CLIP, sviluppata da OpenAI, come base per due diversi modelli di geolocalizzazione delle immagini.

Il primo modello, Predicting Image Geolocations (PIGEON), è stato addestrato utilizzando un set di dati di circa 100.000 località del gioco GeoGuessr. Per ogni luogo, a PIGEON è stato fornito un panorama a 360 gradi ricavato da un insieme di quattro immagini di Google Street View.

Il secondo modello, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), è stato addestrato esclusivamente su oltre 4 milioni di immagini Flickr georeferenziate provenienti da tutto il mondo.

Quando gli è stata presentata un'immagine di Google Street View di una qualsiasi parte del mondo, PIGEON è stato in grado di indovinare il paese correttamente 95% delle volte e di individuare la posizione entro circa 16 miglia poco più di 40% delle volte.

I ricercatori hanno poi messo PIGEON contro i migliori giocatori di GeoGuessr, dove li ha battuti con un margine significativo.

L'errore di distanza di geolocalizzazione di PIGEON rispetto ai giocatori umani di GeoGuessr di vari livelli di abilità nel gioco in 458 partite a più turni. La divisione Champion è composta dai migliori 0,01% di giocatori. Fonte: arXiv

PIGEOTTO, che è un modello più generalizzato, ha battuto con ampio margine gli attuali modelli allo stato dell'arte sui dataset di riferimento per la geolocalizzazione.

Quando PIGEON ha affrontato Trevor Rainbolt, considerato uno dei migliori geografi in circolazione, lo ha battuto più volte. Ricorda un po' Deep Blue che batteva Gary Kasparov a scacchi nel 1997.

Considerazioni etiche

L'utilità di questi modelli va oltre il potenziale di imbroglio di GeoGuessr. La carta ha osservato che i modelli potrebbero essere utilizzati per "la guida autonoma, la navigazione, l'educazione geografica, l'intelligence open-source e le indagini visive nel giornalismo".

Con l'inevitabile miglioramento dell'accuratezza di questi modelli, i problemi di privacy diventano sempre più preoccupanti. Oltre all'identificazione della posizione dell'utente, altri problemi di privacy includono la capacità di alcuni modelli di dedurre il reddito locale, la razza, l'istruzione e i modelli di voto dai dati di geolocalizzazione delle immagini.

C'è anche un forte interesse da parte del industria della difesa in ciò che questi modelli possono fare. I ricercatori dell'Università di Stanford hanno dichiarato: "A nostra conoscenza, questo è il primo lavoro di geolocalizzazione di immagini all'avanguardia degli ultimi cinque anni che non sia stato finanziato da contratti militari".

Come per molte tecnologie di intelligenza artificiale, i rischi di doppio uso associati a questi modelli sollevano problemi etici che dovranno essere gestiti in qualche modo.

Con Meta che addestra i suoi modelli sulle vostre foto di Instagram, vale la pena ricordare che i vostri selfie rivelano all'intelligenza artificiale più di quanto pensiate.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Eugene van der Watt

Eugene proviene da un background di ingegneria elettronica e ama tutto ciò che è tecnologico. Quando si prende una pausa dal consumo di notizie sull'intelligenza artificiale, lo si può trovare al tavolo da biliardo.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni