OpenAI ответила на два почти идентичных коллективных иска, поданных против нее рядом авторов, и заявила, что большинство обвинений должно быть отклонено.
Авторы утверждают, что их авторские права были нарушены, когда компания использовала их работу в качестве обучающих данных для ChatGPT. Утверждения в иске таковы:
- прямое нарушение авторских прав
- заместительное нарушение авторских прав
- удаление информации об управлении авторскими правами (DMCA)
- недобросовестная конкуренция
- неосновательное обогащение
- халатность
OpenAI заявляет, что она рада, что первое обвинение будет оспорено в суде, но остальные пять являются неверными с юридической точки зрения и должны быть отклонены.
Истцы утверждают, что, поскольку их книги использовались для обучения ChatGPT, все, что выдает ChatGPT, является производным от их работы, защищенной авторским правом.
OpenAI заявляет, что не подтверждает и не отрицает, что книги, о которых идет речь, были частью обучающего набора данных. Но, по словам компании, даже если книги и были включены в набор данных, это была крошечная часть огромного объема данных.
OpenAI утверждала, что это подпадает под принцип добросовестного использования, который не нарушает авторских прав.
Авторам, возможно, будет нелегко убедить суд в своей правоте. Они не утверждают, что ChatGPT пишет книги, похожие на их, и конкурирует с ними. Они утверждают, что каждое слово, выложенное ChatGPT, является нарушением авторских прав.
В своем ходатайстве об отказе OpenAI заявила: "Согласно жалобам, каждый вывод ChatGPT - от простого ответа на вопрос (например, "Да"), имени президента США до абзаца, описывающего сюжет, темы и значение "Илиады" Гомера - обязательно является нарушающим авторские права "производным произведением" книг истцов".
С этим будет трудно поспорить. Даже точные резюме, которые ChatGPT составляет о книгах, о которых идет речь, описаны в ходатайстве как напоминающие "книжные отчеты или обзоры", а не попытку извлечь прибыль из защищенного авторским правом произведения.
Подробную информацию об остальных аргументах можно прочитать в Ходатайство OpenAI о прекращении дела.
Почему OpenAI не просит закрыть все дело?
В ходатайстве OpenAI говорится, что она не просит отклонить обвинение в прямом нарушении авторских прав, "которое OpenAI будет пытаться разрешить как вопрос права на более поздней стадии дела".
OpenAI и Meta не раскрыли, какие именно данные они использовали для обучения своих моделей, но почти наверняка среди них было много материалов, защищенных авторским правом, включая книги авторов, подавших иски.
Если данные, защищенные авторским правом, были включены, то OpenAI, безусловно, знала об этом. Компания будет утверждать, что целью доступа к материалам не было создание производных работ и извлечение из них прибыли, конкурирующей с оригиналами.
Если суд согласится с этим решением, то оно создаст прецедент, на который можно будет опираться в ряде других судебных процессов, связанных с искусственным интеллектом, находящихся в процессе рассмотрения.
Решение в пользу компании будет означать, что на нее нельзя будет подать в суд за использование данных, защищенных авторским правом, и что она сможет продолжать использовать их для обучения своих новых моделей. А если суд решит, что обучение ИИ подпадает под принцип добросовестного использования, то для других ИИ-компаний тоже будет открыт сезон.
Это рискованный шаг, но в какой-то момент этот вопрос придется решать. Если решение будет принято не в пользу OpenAI, то ей придется отказаться от ChatGPT и начать обучение с нуля. На этот раз с гораздо меньшим набором данных.