В настоящее время Reddit находится под пристальным вниманием Федеральной торговой комиссии (FTC) из-за практики лицензирования данных искусственного интеллекта, которая была раскрыта перед запланированным IPO.
В центре внимания FTC - "продажа, лицензирование или обмен пользовательским контентом Reddit с третьими лицами для обучения моделей искусственного интеллекта".
Reddit готовится к выходу на биржу, планируя разместить свои акции по цене от $31 до $34, что может оценить компанию примерно в $6,5 миллиарда.
Reddit - это одна из крупнейших золотых жила в истории интернет-контента. Его намерение продавать посты и комментарии вызвало бурную дискуссию среди 850 миллионов среднемесячных пользователей.
Один из постов на Reddit озаглавлен "Поскольку Reddit теперь официально продает данные пользователей, ваши истории в безопасности?", а ответившие на него согласились "начать сбрасывать бесполезные мусорные данные на Reddit каждый день в течение следующих шестидесяти дней".
Это интересный момент - данные Reddit очень чувствительны к вкладу пользователей, и, имея такие сильные сообщества, компания не должна слишком успокаиваться по поводу своих прав на пользовательский контент.
Тем не менее, Reddit утверждает, что продажа данных остается в гармонии со своими принципами, заявляя: "Эта возможность не противоречит нашим ценностям и правам наших участников Redditors".
Финансовые перспективы Reddit выглядят уверенно: в прошлом году выручка компании выросла на 20% и составила $804 миллиона, в основном за счет рекламы.
К настоящему времени Reddit раскрыла информацию о заключении соглашений о лицензировании данных на сумму $203 миллиона. В 2024 году компания рассчитывает получить от этих соглашений не менее $66,4 миллиона. Это скромная часть общего потока доходов, но она может расти в геометрической прогрессии.
Reddit уже заключил партнерство с Google, направленное, помимо прочего, на обучение моделей искусственного интеллекта. Это подчеркивает важность его данных в мире, где технологические компании все чаще готовы платить за свои данные, а не просто использовать сомнительные источники "общественного пользования".
Размышляя над комментариями FTC, Reddit заявилМы не удивлены тем, что ФТК проявила интерес" к практике лицензирования данных, объясняя это "новизной этих технологий и коммерческих соглашений".
Кроме того, Reddit заявляет о своей уверенности в законности своих действий, подчеркивая: "Мы не считаем, что занимались нечестной или обманчивой торговой практикой".
Компания также поделилась информацией о текущем диалоге с FTC, отметив: "В письме указывалось, что сотрудники FTC заинтересованы во встрече с нами, чтобы узнать больше о наших планах, и что FTC намерена запрашивать у нас информацию и документы по ходу своего расследования".
В последнее время FTC занимает более жесткую позицию по отношению к технологическим сделкам: агентство разрешило новые следственные полномочия в ноябре прошлого года над компаниями, занимающимися искусственным интеллектом.
Новая золотая лихорадка платных данных
Данные обходятся компаниям, занимающимся разработкой генеративного ИИ, очень дешево: базы данных, созданные такими веб-организациями, как Common Crawl и LAION, составляют основу обучающих данных.
Однако ситуация меняется, поскольку иски об авторском праве становятся все более многочисленными, а Закон ЕС об искусственном интеллекте пытаются ввести более строгие правила работы с данными в отрасли.
Более того, многие сайты активно блокирует Веб-краулеры с искусственным интеллектом. Эра Дикого Запада бесплатных данных для обучения может закончиться.
Reddit - не единственная компания, которая знает цену своему контенту. Automattic, материнская компания WordPress и Tumblr, является по сообщениям, ведет переговоры с компаниями MidJourney и OpenAI для заключения сделки по предоставлению контента и данных.
Пока Reddit готовится к IPO, за траекторией развития компании будут пристально следить как регуляторы, так и участники Reddit.