Google утверждает, что все общедоступные данные в интернете можно использовать для обучения своих продуктов искусственного интеллекта.
Google's обновленная политика конфиденциальности теперь гласит, что "Google использует информацию для улучшения наших сервисов и разработки новых продуктов, функций и технологий, которые приносят пользу нашим пользователям и обществу". Далее говорится, что общедоступная информация используется для "обучения моделей искусственного интеллекта Google и создания таких продуктов и функций, как Google Translate, Bard и облачные возможности искусственного интеллекта".
В предыдущей версии политики говорилось о том, что Google использует данные для обучения "языковых моделей", тогда как теперь речь идет о "моделях искусственного интеллекта", что расширяет сферу применения.
Нечеткое определение "информации" и расширенные цели для обучения с использованием этих данных, похоже, указывают на то, что если вы разместите что-то в Интернете, ожидайте, что Google соскоблит это и добавит в свои данные для обучения.
Мы понимаем, что если мы оставляем комментарий на Facebook, пишем в Twitter или пишем отзыв на Amazon, то все это становится достоянием общественности. Вы не ожидаете, что это будет конфиденциально. Но вы согласны с тем, чтобы ваши слова использовались для обучения модели искусственного интеллекта?
Изменение формулировки политики может также свидетельствовать о намерении Google активизировать свои усилия по поиску информации. Темпы, с которыми Google и другие компании, использующие искусственный интеллект, занимаются соскабливанием общедоступных данных, оказывают разрушительное воздействие на многочисленные платформы.
Недавно Twitter ограничил доступ к своим сервисам, поскольку его серверы не справлялись с "экстремальным уровнем соскабливания данных и манипуляций с системой", по словам Элона Маска. В попытке обуздать скреперов Twitter также удалил бесплатный доступ к своему API, что привело к поломке множества сторонних сервисов, которые полагались на API.
Reddit также не остался в стороне от этой гонки за данными. Он тоже закрыл свободный доступ к API Reddit, отчасти из-за эксплуатации скреперами. В результате ответной реакции модераторов Reddit, использующих API, часть интернета была фактически закрыта.
Сотни крупнейших сабреддитов стали закрытыми или невидимыми благодаря протестующие модераторы сабреддитов. Владельцы Reddit ставят модераторам не слишком деликатные ультиматумы, чтобы те снова открыли подредактиты, но протест продолжается.
Ирония заключается в том, что в результате страдает и Google. Добавление слова "Reddit" к поисковому запросу Google стало популярным способом получения очень специфических результатов по запросу. Отключение Reddit сделало многие из этих результатов поиска недоступными.
Большинство платформ имеют условия предоставления услуг, запрещающие соскабливание данных, но нарушение условий предоставления услуг не обязательно равносильно нарушению закона. Пока они пытаются решить эту проблему, убедитесь, что вы не против того, чтобы Google и другие компании использовали ваши данные для обучения своих моделей искусственного интеллекта, прежде чем публиковать что-либо в сети.