Adobe VideoGigaGAN масштабирует размытое видео, чтобы оно выглядело в 8 раз четче

25 апреля 2024 года
  • Исследователи Adobe разработали видеоувеличитель с искусственным интеллектом, который делает размытые видео до 8 раз четче
  • VideoGigaGAN преодолевает недостаток детализации, мерцание и алиасинг, которые характерны для апскейлеров видео.
  • Для VideoGigaGAN разработаны значительные приложения, но Adobe не назвала дату выхода.

Исследователи Adobe представили VideoGigaGAN - генеративную модель искусственного интеллекта, которая позволяет масштабировать размытое видео в четкое и плавное видео, которое выглядит в 8 раз четче.

У нас уже давно есть действительно хорошие апскейлеры изображений, но сделать хороший апскейлер видео в геометрической прогрессии сложнее.

Сверхвысокое разрешение видео (VSR) - это процесс получения отдельных кадров видео, повышения разрешения и детализации, а также совмещения кадров для воссоздания видео.

Для этого необходимо решить две противоречивые задачи. Нынешние VSR либо генерируют плавное и размытое видео, либо резкое и глючное.

Программа VideoGigaGAN от Adobe повышает качество размытого видео, чтобы получить видео с временной последовательностью (плавные переходы между кадрами) и высокочастотными деталями.

Вот пример того, что может сделать VideoGigaGAN.

Как следует из названия, метод Adobe основан на GigaGAN, продвинутой генеративной состязательной сети (GAN).

GAN отлично справляются с апсемплингом изображений, а GigaGAN - один из лучших в области сверхразрешения изображений. Так почему бы просто не использовать GigaGAN на каждом кадре для повышения разрешения изображения, а затем соединить их вместе, чтобы получить видео?

Когда исследователи Adobe попробовали это сделать, они добились отличного разрешения видео, но полученное видео было непоследовательным во времени и мерцало.

Добавив к GigaGAN временные конволюционные слои и слои внимания, временная несогласованность была устранена, но мерцание по-прежнему оставалось проблемой.

VideoGigaGAN решает эту проблему, разделяя низкочастотные и высокочастотные элементы в каждом кадре и обрабатывая их по-разному.

Карта низкочастотных характеристик сглаживается, чтобы удалить высокочастотные детали, которые могут быть источниками шума и мерцания.

С помощью скиповых соединений сохраняются более тонкие детали высокочастотных компонентов, минуя средние слои модели, которые в противном случае были бы потеряны при обработке.

Более подробно о технических деталях вы можете прочитать в Бумага Adobe.

Сайт демо-версии на GitHub компании Adobe очень впечатляют. Adobe пока не называет дату выхода, но будем надеяться, что они позволят нам использовать его в ближайшее время.

Представьте себе, что подобный инструмент может сделать с историческими архивными материалами, классическими фильмами или даже с повышением качества ваших любимых старых телепередач до HD.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×
 
 

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI


 

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".



 
 

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения