Исследователи из Техасского университета в Остине разработали инновационную систему обучения моделей искусственного интеллекта на сильно испорченных изображениях.
Этот метод, известный как Ambient Diffusion, позволяет моделям искусственного интеллекта "черпать вдохновение" из изображений без непосредственно копируя их.
Традиционные модели преобразования текста в изображение, используемые DALL-EMidjourney и Stable Diffusion рискуют нарушить авторские права, поскольку они обучаются на наборах данных, включающих изображения, защищенные авторским правом, что приводит к тому, что они иногда случайно воспроизводят эти изображения.
Ambient Diffusion переворачивает все с ног на голову, обучая модели на заведомо испорченных данных.
В исследованиеИсследовательская группа, в которую вошли Алекс Димакис и Гианнис Дарас с факультета электротехники и вычислительной техники UT Austin и Константинос Даскалакис из MITМы обучили модель Stable Diffusion XL на наборе данных из 3 000 изображений знаменитостей.
Изначально было замечено, что модели, обученные на чистых данных, откровенно копируют обучающие примеры.
Однако когда обучающие данные были испорчены - случайным образом маскировалось до 90% пикселей, - модель все равно выдавала высококачественные уникальные изображения.
Это означает, что искусственный интеллект никогда не сталкивается с узнаваемыми версиями оригинальных изображений, что не позволяет ему копировать их.
"Наша система позволяет контролировать компромисс между запоминанием и производительностью". объяснил Гианнис Дарас, аспирант факультета компьютерных наук, руководивший работой.
"По мере того как уровень коррупции, с которой приходится сталкиваться во время обучения, возрастает, запоминание обучающего набора снижается".
Научные и медицинские приложения
Применение Ambient Diffusion выходит за рамки решения проблем с авторскими правами.
По словам профессора Адама Кливанса, сотрудника проекта, "фреймворк может оказаться полезным и для научных и медицинских приложений. Это касается практически любых исследований, где дорого или невозможно получить полный набор неповрежденных данных, от визуализации черных дыр до некоторых видов магнитно-резонансной томографии".
Это особенно полезно в областях с ограниченным доступом к неискаженным данным, таких как астрономия и физика элементарных частиц.
В этих и других областях данные могут быть очень шумными, некачественными или разреженными, то есть значимые данные сильно преобладают над бесполезными. Обучение моделей более эффективному использованию неоптимальных данных было бы полезным.
Если подход Ambient Diffusion будет доработан, компании, занимающиеся разработкой ИИ, смогут создавать функциональные модели преобразования текста в изображение, соблюдая при этом права создателей оригинального контента и предотвращая возникновение юридических проблем.
Хотя это и не решит проблемы, связанной с тем, что инструменты искусственного интеллекта сокращают количество работы для настоящих художников, это, по крайней мере, защитит их работы от случайного копирования в выходных данных.