Исследователи из Стэнфордского университета создали модели искусственного интеллекта, которые могут с поразительной точностью определять, где была сделана фотография. Для их решения есть хорошие сценарии использования, но необходимо решить и важные этические проблемы.
Если на вашем праздничном снимке позади вас Эйфелева башня или гора Рашмор, то определить, где была сделана фотография, довольно просто. Если же снимок сделан в поле в Иллинойсе, а позади вас стоит случайное дерево, то определить место съемки будет гораздо сложнее.
Это как раз то испытание, которое предстоит пройти более чем 50 миллионам игроков в GeoGuessr наслаждайтесь игрой.
Трое исследователей из Стэнфордского университета были заядлыми игроками в эту игру и хотели посмотреть, как модели искусственного интеллекта справятся с лучшими человеческими игроками.
Они начали с нейронной сети CLIP, разработанной OpenAI, в качестве основы для двух различных моделей геолокализации изображений.
Первая модель, Predicting Image Geolocations (PIGEON), была обучена на базе данных, включающих около 100 000 мест из игры GeoGuessr. Для каждого места PIGEON предоставлялась 360-градусная панорама, созданная из набора четырех изображений Google Street View.
Вторая модель, Predicting Image Geolocations with Omni-Terrain Training Optimizations (PIGEOTTO), была обучена исключительно на более чем 4 миллионах изображений Flickr с геометками со всего мира.
Когда ему было представлено изображение любой точки мира из Google Street View, PIGEON правильно угадывал страну в 95% случаев и определял местоположение в пределах 16 миль в 40% случаев.
Затем исследователи поставили PIGEON в сравнение с лучшими игроками GeoGuessr, и он обошел их со значительным отрывом.
PIGEOTTO, которая является более обобщенной моделью, с большим отрывом опередила современные модели на эталонных наборах данных геолокации.
Когда PIGEON сразился с Тревором Рейнболтом, считающимся одним из лучших геогуру в мире, он победил его несколько раз. Это немного напоминает, как Deep Blue обыграл Гари Каспарова в шахматы в 1997 году.
Мы создали искусственный интеллект, чтобы сразиться с лучшим в мире игроком GeoGuessr, и победили! 🔎🌍🏆
На сайте @geoguessr>50 миллионов игроков соревнуются в угадывании местоположения по случайным точкам на Google Street View. 🗺️
Спасибо @georainbolt за веселый вызов!https://t.co/g7tIeUELz5
- Лукас Хаас (@lkshaas) 13 мая 2023 года
Этические соображения
Полезность этих моделей выходит за рамки возможности обмана в GeoGuessr. Газета отмечает, что модели могут быть использованы в "автономном вождении, навигации, обучении географии, разведке с открытым исходным кодом и визуальных расследованиях в журналистике".
По мере того как точность этих моделей неизбежно повышается, вопросы конфиденциальности становятся все более актуальными. Помимо определения вашего местоположения, к проблемам конфиденциальности относится способность некоторых моделей определять уровень доходов, расовую принадлежность, образование и характер голосования на основе данных геолокации изображений.
Также большой интерес вызывает оборонная промышленность в том, на что способны эти модели. Исследователи Стэнфордского университета заявили: "Насколько нам известно, это первая современная работа по геолокализации изображений за последние пять лет, которая не финансируется военными контрактами".
Как и в случае со многими другими технологиями ИИ, риски двойного назначения, связанные с этими моделями, вызывают этические проблемы, которые необходимо как-то решать.
Учитывая, что такие компании, как Meta, обучают своих моделей на ваших фотографиях в Instagram, стоит помнить, что ваши селфи открывают искусственному интеллекту больше, чем вы думаете.