В письменном заявлении, направленном в Палату лордов Великобритании, OpenAI заявила, что создание инструментов ИИ без использования материалов, защищенных авторским правом, "невозможно".
Это происходит на фоне обострения дебатов вокруг взаимодействия авторских прав с ИИ: авторы, писатели и СМИ, такие как New York Times, подали иски против OpenAI, Microsoft, Stability AI, Anthropic, Google и Midjourney, и это лишь некоторые из них.
Большие языковые модели (LLM), такие как ChatGPT, и генераторы изображений, такие как Midjourney, который недавно попал в заголовки новостей, создав база данных 16 000 художников для обучения моделей опираются на обширные данные, защищенные авторским правом.
Фактически, данные об авторских правах составляют основу учебного материала для ИИ, поскольку их много, они охватывают широкий спектр человеческого творчества и легко извлекаются из Интернета.
Компании, занимающиеся разработкой искусственного интеллекта, утверждают, что эти данные "честно используются" для обучения их моделей, но многие другие с этим не согласны.
В своем ответе на вопросы комитета Палаты лордов по коммуникациям и цифровым технологиям OpenAI недавно подчеркнула свою потребность в материалах, защищенных авторским правом, для обучения LLM, таких как GPT-4.
OpenAI заявила: "Поскольку авторское право сегодня распространяется практически на все виды человеческих высказываний - включая записи в блогах, фотографии, сообщения на форумах, фрагменты программного кода и правительственные документы, - было бы невозможно обучать ведущие современные модели ИИ без использования материалов, защищенных авторским правом".
Компания также утверждала, что ограничение учебных материалов источниками, находящимися в открытом доступе, приведет к созданию некачественных систем искусственного интеллекта.
"Ограничение обучающих данных книгами и рисунками, находящимися в общественном достоянии и созданными более века назад, может дать интересный эксперимент, но не позволит создать системы ИИ, отвечающие потребностям современных граждан", - добавили в OpenAI.
Вы можете прочитать всю письменные доказательства здесьВ нем также затрагиваются вопросы будущей траектории развития ИИ, катастрофических рисков, на которые OpenAI рекламирует свой форум Frontier Model Forum и команду по обеспечению готовности, а также регулирования.
Общественность реагирует
Реакция на эти заявления была не совсем благожелательной.
Доктор Гэри Маркус (Gary Marcus), видный деятель отрасли, говорит, что это, по сути, самомаркирует модели ИИ как средство монетизации украденных авторских работ.
Действительно, кажется, что это почти фрейдистский промах со стороны OpenAI, признающий, что их бизнес-модель не работает без манипуляций с законом.
Ощущается чувство несправедливости, когда так мало людей в верхних эшелонах Кремниевой долины пользуются плодами труда столь многих.
В заявлении OpenAI также утверждается, что они понимают "нужды" современных "граждан", обнажая растущее несоответствие между взглядом больших технологий на генеративный ИИ как на гуманитарный и даже филантропический проект и опасениями людей, что он крадет их данные и вытесняет их навыки.
Доктор Маркус отметил: "[Компании, занимающиеся разработкой искусственного интеллекта]...должны вернуться к чертежной доске и придумать, как создать программное обеспечение, в котором не будет проблем с плагиатом, а не обдирать художников, писателей и других поставщиков контента".
Теперь мы знаем, почему Сэм Альтман прошлым летом объездил весь мир, встречаясь с мировыми лидерами: его компания не добьется успеха, если не убедит правительства дать ей одну из самых больших подачек в истории. https://t.co/Pcc8FchG1a
- Гэри Маркус (@GaryMarcus) 8 января 2024 года
Судебные иски растут
Это также произошло на фоне нескольких судебных исков против OpenAI, в которых приняли участие такие известные авторы, как Джон Гришэм, Джоди Пикоулт и Джордж РР Мартин. подал иск против компании в сентябре в прошлом году за предполагаемое "систематическое воровство в массовом масштабе".
Два уважаемых журналиста, Николас Гейдж и Николас Басбанес, подали еще одну жалобу против OpenAI и Microsoft на прошлой неделеЭто добавляет к растущему числу юридических проблем, с которыми сталкиваются компании, работающие с искусственным интеллектом, как в писательском, так и в изобразительном искусстве.
OpenAI также ответила на иск New York Times, заявив, что считает его "необоснованным", см. ниже.
Мы создаем искусственный интеллект для расширения возможностей людей, в том числе журналистов.
Наша позиция по @nytimes иск:
- Обучение является добросовестным использованием, но мы предоставляем возможность отказаться от него
- "Срыгивание" - редкая ошибка, которую мы сводим к нулю
- New York Times рассказывает не всю историюhttps://t.co/S6fSaDsfKb- OpenAI (@OpenAI) 8 января 2024 года
Эти события вызывают опасения по поводу потенциальных юридических обязательств, с которыми компании, использующие искусственный интеллект, могут столкнуться в этом году и в будущем. Как они будут адаптироваться? Повлияет ли растущее сопротивление общественности на траекторию развития отрасли?
Как этично обучать крупномасштабные генеративные модели ИИ? Совместима ли этика с нынешним воплощением этой технологии?
Пока что защита компаний, занимающихся разработкой ИИ, держится, но клин между представлениями разработчиков ИИ о "добросовестном использовании" и тем, как его воспринимают другие, все шире.