Automattic, компания, стоящая за WordPress и Tumblr, обсуждает сделку по предоставлению данных и контента с MidJourney и OpenAI.
Эта информация, первоначально освещенная в 404 СМИ и по сообщениям неназванного источника в компании Automattic, указывает на то, что соглашение с OpenAI и MidJourney может быть заключено в ближайшее время.
Вслед за этим на Tumblr поползли слухи о потенциальной сделке с MidJourney, которая могла бы стать новым источником дохода для платформы.
В 404 говорят, что процесс сделки до сих пор был запутанным, включая частично неудачную передачу данных OpenAI и MidJourney, которые содержали, по словам одного из менеджеров по продуктам Tumblr:
"Приватные сообщения в публичных блогах, сообщения в удаленных или приостановленных блогах, вопросы без ответов (обычно они не публикуются, пока на них не ответят), приватные ответы (они отображаются только у получателя и не публикуются), сообщения, помеченные как "явные" / NSFW / "зрелые" по нашим более современным стандартам (это может быть не так уж важно, я не знаю)".
Последствия этого остаются неясными, и дальнейшие детали сделки будут уточняться.
Золотая лихорадка в поисках данных для обучения ИИ поднимается на новую ступень
И вот так золотая лихорадка в поисках данных для обучения ИИ пошла в гору.
Да, компаниям, занимающимся разработкой генеративного ИИ, всегда требовались огромные объемы данных, но теперь они спешат платить за них, а не выуживать бесплатно.
Всего несколько дней назад, По сообщениям, в Reddit обсуждались Reddit лицензирует свой огромный массив пользовательского контента пока нераскрытой компании, занимающейся разработкой искусственного интеллекта. Сумма сделки может составить около $60 миллионов в год. Все это происходит на фоне того, что Reddit готовится к публичному размещению акций в марте, нацеливаясь на оценку около $5 миллиардов.
Это потенциальное лицензионное соглашение соответствует растущей тенденции среди технологических компаний к заключению законных соглашений об использовании данных, особенно в условиях растущих рисков, связанных с авторскими правами.
Продолжающиеся юридические баталии, такие как Иск "Нью-Йорк ТаймсОни повысили актуальность контента. сделки.
Переход Automattic к переговорам с компаниями, занимающимися разработкой искусственного интеллекта, поднимает вопросы об использовании пользовательского контента для обучения ИИ.
Они якобы объявили о планах ввести новую функцию, которая позволит пользователям отказаться от передачи своих данных третьим лицам, включая компании, занимающиеся разработкой искусственного интеллекта.
Automattic сделал публичное заявление После сообщения 404 мы опубликовали следующее заявление: "В настоящее время мы по умолчанию блокируем основные краулеры для платформ искусственного интеллекта - в том числе от крупнейших технологических компаний - и обновляем наши списки по мере запуска новых", а также "будем делиться только публичным контентом, размещенным на WordPress.com и Tumblr, с сайтов, которые не отказались от этого".
И далее: "Мы также работаем напрямую с некоторыми компаниями, занимающимися разработкой искусственного интеллекта, если их планы соответствуют тому, что волнует наше сообщество: атрибуция, отказ от использования и контроль".
Однако отказ от использования вашей информации для обучения искусственного интеллекта может повлечь за собой штрафные санкции в отношении аккаунтов пользователей.
В новом, еще не опубликованном FAQ под названием "Что происходит, когда вы отказываетесь?" говорится: "Если вы откажетесь с самого начала, мы заблокируем доступ краулеров к вашему контенту, добавив ваш сайт в список запрещенных. Если вы передумаете позже, мы также планируем обновить информацию о людях, которые недавно отказались от участия в проекте, и попросить удалить их контент из прошлых источников и будущих тренировок".
Мы живем в мире, где все, что вы разместили в Интернете, может быть продано для целей обучения искусственного интеллекта - если это не будет сделано бесплатно.
И по мере развития ИИ споры об использовании данных и конфиденциальности, скорее всего, будут только обостряться.
Компании, владеющие золотыми жилами данных, могут выиграть много, но какой ценой это обойдется рядовому пользователю Интернета?