Исследователи обучают модель создавать изображения, не "видя" работы, защищенной авторским правом

Май 21, 2024

  • Исследователи из Техасского университета обучили модель изображения на испорченных данных
  • Несмотря на то, что изображения искажаются и дробятся, он по-прежнему прекрасно работает.
  • Это показывает, как модели генерации изображений могут обучаться без авторских данных
Создание изображений

Исследователи из Техасского университета в Остине разработали инновационную систему обучения моделей искусственного интеллекта на сильно испорченных изображениях. 

Этот метод, известный как Ambient Diffusion, позволяет моделям искусственного интеллекта "черпать вдохновение" из изображений без непосредственно копируя их.

Традиционные модели преобразования текста в изображение, используемые DALL-EMidjourney и Stable Diffusion рискуют нарушить авторские права, поскольку они обучаются на наборах данных, включающих изображения, защищенные авторским правом, что приводит к тому, что они иногда случайно воспроизводят эти изображения. 

Ambient Diffusion переворачивает все с ног на голову, обучая модели на заведомо испорченных данных.

В исследованиеИсследовательская группа, в которую вошли Алекс Димакис и Гианнис Дарас с факультета электротехники и вычислительной техники UT Austin и Константинос Даскалакис из MITМы обучили модель Stable Diffusion XL на наборе данных из 3 000 изображений знаменитостей. 

Изначально было замечено, что модели, обученные на чистых данных, откровенно копируют обучающие примеры. 

Однако когда обучающие данные были испорчены - случайным образом маскировалось до 90% пикселей, - модель все равно выдавала высококачественные уникальные изображения.

Это означает, что искусственный интеллект никогда не сталкивается с узнаваемыми версиями оригинальных изображений, что не позволяет ему копировать их.

"Наша система позволяет контролировать компромисс между запоминанием и производительностью". объяснил Гианнис Дарас, аспирант факультета компьютерных наук, руководивший работой. 

"По мере того как уровень коррупции, с которой приходится сталкиваться во время обучения, возрастает, запоминание обучающего набора снижается".

Научные и медицинские приложения

Применение Ambient Diffusion выходит за рамки решения проблем с авторскими правами. 

По словам профессора Адама Кливанса, сотрудника проекта, "фреймворк может оказаться полезным и для научных и медицинских приложений. Это касается практически любых исследований, где дорого или невозможно получить полный набор неповрежденных данных, от визуализации черных дыр до некоторых видов магнитно-резонансной томографии".

Это особенно полезно в областях с ограниченным доступом к неискаженным данным, таких как астрономия и физика элементарных частиц

В этих и других областях данные могут быть очень шумными, некачественными или разреженными, то есть значимые данные сильно преобладают над бесполезными. Обучение моделей более эффективному использованию неоптимальных данных было бы полезным.

Если подход Ambient Diffusion будет доработан, компании, занимающиеся разработкой ИИ, смогут создавать функциональные модели преобразования текста в изображение, соблюдая при этом права создателей оригинального контента и предотвращая возникновение юридических проблем.

Хотя это и не решит проблемы, связанной с тем, что инструменты искусственного интеллекта сокращают количество работы для настоящих художников, это, по крайней мере, защитит их работы от случайного копирования в выходных данных.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения