Генеральный директор YouTube предупреждает OpenAI о возможном нарушении условий предоставления услуг

5 апреля 2024 года

  • Генеральный директор YouTube Нил Мохан обсудил возможные нарушения условий со стороны OpenAI
  • Если бы Сора обучалась на видеороликах YouTube, это было бы "явным нарушением".
  • Sora - сложная модель преобразования текста в видео от OpenAI, которая все еще находится в стадии тестирования
OpenAI YouTube

Генеральный директор YouTube Нил Мохан (Neal Mohan) заявил, что потенциальное использование OpenAI видеороликов YouTube для обучения модели преобразования текста в видео Sora нарушает условия предоставления услуг. 

Мохан сказал Bloomberg: "Если бы Sora использовала контент с YouTube, это было бы "явным нарушением" условий предоставления услуг".

Между YouTube и OpenAI не будет потеряна любовь, ведь каждый из них находится по разные стороны от Больших Технологий. 

Sora - это новая революционная модель превращения текста в видео от OpenAI, которая все еще тестируется. Она знаменует собой завоевание генеративным ИИ всех форм медиа, начиная с текста, затем изображений, а теперь аудио и видео. 

Генеративное видео и аудио несут в себе новые риски для компаний, занимающихся разработкой искусственного интеллекта, например то, что их модели создают почти точные копии материалов, защищенных авторским правом. 

Мы уже наблюдали это на примере модели "текст в аудио" Suno, которая производит очень похожие аудио к известным песням например, "Богемская рапсодия" группы Queen и "Танцующая королева" группы ABBA. 

Ни OpenAI, ни большинство компаний, занимающихся разработкой искусственного интеллекта, не были особо прозрачны в том, что для обучения моделей они используют огромные объемы данных из интернета, включая материалы, защищенные авторским правом. 

OpenAI даже признала, что в процессе разработки ей приходится обходиться без данных, защищенных авторским правом, заявив в своем заявлении Британская палата лордов что "без него было "невозможно" создать технологию". 

Это был своего рода фрейдистский промах, который раскрыл неудобную правду о данных для обучения ИИ.

Однако, несмотря на то, что OpenAI заявляет, что данные об авторских правах однозначно важны для генеративного ИИ, их нарушение еще не было доказано в суде, что говорит о том, что закон об авторских правах в его нынешнем воплощении просто не был рожден для этой эпохи. 

Что касается конкретно обучения Соры, то технический директор OpenAI Мира Мурати в интервью Wall Street Journal, похоже, не знала, какой контент использовался для обучения Соры, в том числе был ли задействован какой-либо контент YouTube. 

Мурати ответил: "Я не уверен в этом", - когда его спросили об источниках контента для обучения Соры, добавив, что все использованные данные были либо "общедоступными, либо лицензированными".

Это не блестящий отчет о прозрачности для OpenAI, поскольку они готовятся выпустить свою революционную новую модель - ту, которую они уже используют для тендер на ведение бизнеса в Голливуде для потенциального применения в кино и на телевидении. 

Сора уже заставила продюсера Тайлера Перри поставить на паузу Расширение студии $800 миллионовЭто намекает на потенциально серьезные потрясения для творческих индустрий. 

Генеральный директор YouTube рассказывает о Соре

Генеральный директор YouTube Мохан продемонстрировал свою осведомленность о ведущихся дискуссиях по поводу методов обучения ИИ. Он намекнул, что OpenAI необходимо разъяснить использование данных YouTube. 

Он рассказал Bloomberg"С точки зрения создателя, когда он загружает свою работу на нашу платформу, у него есть определенные ожидания. Одно из этих ожиданий - соблюдение условий предоставления услуг. Не допускается скачивание таких вещей, как транскрипты или видеофрагменты, и это является явным нарушением наших условий обслуживания. Таковы правила дорожного движения в отношении контента на нашей платформе".

Условия предоставления услуг YouTube прямо "запрещают несанкционированное копирование или загрузку контента YouTube", что подтвердил представитель YouTube в связи с комментариями Мохана.

Alphabet, родитель YouTube, активно развивает свои собственные инструменты искусственного интеллекта. Мы можем ожидать ответной реакции, если OpenAI прямо или косвенно использовала видео с YouTube для обучения Sora. 

Золотая лихорадка данных ИИ привела к стратегическим партнерствам и лицензионным соглашениям между технологическими компаниями и поставщиками контента. Многочисленные судебные иски В области генерации текстов и изображений продолжаются исследования, но они по-прежнему остаются неубедительными. 

Во-первых, даже если модели ИИ раскрывают себя, воспроизводя работы, защищенные авторским правом (например, MidJourney выплевывание изображений из фильмов Marvel или "Симпсонов"), их природа "черного ящика" делает практически невозможным определить, где были получены эти данные и когда именно произошло нарушение. 

Во-вторых, хотя созданные искусственным интеллектом аудио, изображения, видео и т. д. могут служить убедительным доказательством нарушения авторских прав, это не так однозначно, как если бы вы или я скопировали изображение Микки Мауса и продали его за миллионы без разрешения. 

В ответ на это юридическое давление компании, занимающиеся разработкой искусственного интеллекта, начинают работать с ценными данными. 

Например, $60 миллионов в год от Reddit Лицензионная сделка с Google по обучению ИИ-инструментам является примером официальных договоренностей, возникающих в отрасли. 

Кроме того, такие медийные организации, как The Associated Press и Axel Springer заключили соглашения разрешить использовать их контент для обучения ИИ, предусмотрев при этом указание авторства в ответах, создаваемых ИИ.

Это создает свои проблемы. Генеративный ИИ требует больших затрат на создание и эксплуатацию, и теперь компании, занимающиеся разработкой ИИ, должны платить за данные, а не просто извлекать их из Интернета. 

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения