Сегодня New York Times (NYT) подала иск против OpenAI и Microsoft, утверждая, что компании нарушили ее авторские права, используя ее контент для обучения своих моделей искусственного интеллекта.
Ни Microsoft, ни OpenAI не хотят подтверждать, какие именно данные использовались для обучения их моделей, но становится все более очевидным, что это было практически все, что можно найти в Интернете.
В апреле The Times обратилась к Microsoft и OpenAI, чтобы обсудить свои опасения по поводу использования их контента. В судебных документах отмечается, что, несмотря на эти усилия, они не смогли прийти к соглашению. В августе они заявили, что рассматривает возможность подачи судебного иска и теперь они наконец-то это сделали.
Подача утверждает, что модели искусственного интеллекта, которые OpenAI и Microsoft обучали на контенте NYT, "лишают The Times доходов от подписки, лицензирования, рекламы и партнерских отношений".
Когда пользователи задают ChatGPT или Copilot вопрос о чем-то, о чем писала газета The Times, эти модели, как утверждается в иске, "генерируют результаты, которые дословно пересказывают содержание Times, тщательно обобщают его и имитируют его выразительный стиль", причем часто без ссылок на оригинальную статью.
Когда пользователи получают ответы в ChatGPT, не переходя на сайт The Times, компания теряет доходы от рекламы и подписки.
Медиакомпания также владеет такими сайтами обзоров, как Wirecutter. The Times утверждает, что содержание обзоров часто воспроизводится чат-ботами с искусственным интеллектом, а реферальные ссылки удаляются. Это лишает The Times партнерского реферального дохода.
В иске также утверждается, что склонность ИИ-моделей, таких как ChatGPT, к галлюцинациям вредит репутации издания. Иногда в результате галлюцинаций модели генерируются фактически неверные ответы, которые, тем не менее, приписываются The Times.
Но были ли сделаны копии?
Похоже, что все крупные компании, занимающиеся разработкой искусственного интеллекта, в данный момент заняты судебными разбирательствами по поводу авторских прав. OpenAI, Мета, Microsoft, Стабильная диффузия, и другие в настоящее время участвуют в судебных процессах против авторов, художников и других творческих личностей.
Общий аргумент ответчиков заключается в том, что модели искусственного интеллекта не создают копий данных, на которых они обучаются, и что использование данных, защищенных авторским правом, для обучения подпадает под принцип добросовестного использования.
Примеры, приведенные в иске NYT, не позволяют оспорить эту точку зрения. Вот один из примеров взаимодействия ChatGPT, который дословно дублирует контент из The Times.
В судебном иске приведены многочисленные примеры дословного цитирования статей как ChatGPT, так и Bing Chat / Copilot.
Что поставлено на карту?
В иске Times не называется конкретная цифра, но говорится, что Microsoft и OpenAI должны быть привлечены "к ответственности за миллиарды долларов в виде установленных законом и фактических убытков, которые они должны возместить за незаконное копирование и использование уникальных ценных работ The Times".
В нем также говорится, что помимо прекращения дальнейшего использования контента NYT, "все GPT или другие LLM-модели и обучающие наборы, в которые включены Times Works", должны быть уничтожены.
Если иск будет подан против OpenAI и Microsoft, это создаст прецедент, который почти наверняка заставит других медиаиздателей выстроиться в очередь к своим адвокатам.
Компаниям придется отбраковать свои модели и обучить их заново, но уже без оскорбительного контента.
Для журналистской отрасли на карту поставлена устойчивость высококачественных репортажей. Если они проиграют свой иск, как издатели новостей, такие как The Times, будут финансировать написание статей, на создание которых у репортеров часто уходят сотни часов?
Ни та, ни другая перспектива не радует. Ранее в этом месяце OpenAI заключила лицензионное соглашение с издателем новостей Аксель Шпрингер включить свои новости в ответы ChatGPT. Генерирование и доставка новостей искусственным интеллектом кажется неизбежным.
Многие газеты, которым не удалось перейти от печатных изданий к онлайновому присутствию, уже не существуют. New York Times успешно осуществила этот переход. Как этот издатель и другие будут управлять следующим этапом развития журналистики в эпоху искусственного интеллекта?
Будем надеяться, что нам удастся сохранить как модели ИИ, так и людей-репортеров.