InstantID генерирует репродукции по одному изображению лица

31 января 2024 года

Инструменты искусственного интеллекта могут создавать изображения персонализированных цифровых личностей, но для получения хороших результатов требуется точная настройка LoRA. InstantID - это плагин с нулевым снимком, который позволяет генеративным моделям ИИ создавать последовательные изображения, используя одно эталонное изображение лица.

Чтобы заставить генеративную модель создавать последовательные связные изображения конкретного человека, как правило, необходимо использовать LoRA.

LoRA, сокращение от Low-Rank Adaptation, - это техника, используемая для адаптации моделей генерации изображений без их полного переобучения. Если бы вы хотели, чтобы ваша модель действительно хорошо создавала изображения Тейлор Свифт, вы бы создали LoRA, настроенную на множестве ее изображений.

Создание LoRA требует времени, большого количества эталонных изображений и значительных ресурсов обработки. InstantID меняет все это и может положить конец LoRA для многих приложений.

Команда InstantX создала InstantID - модель с нулевым снимком, которая не требует обучения или тонкой настройки. Используя одно лицо в качестве эталона, InstantID позволяет использовать модель стабильной диффузии из текста в изображение, например SD1.5 или SDXL, для создания большего количества изображений человека.

В нем используется компонент IdentityNet, который фокусируется на определенных элементах лица на эталонном изображении, а не на других элементах на эталонном изображении.

Одно из главных преимуществ InstantID - последовательная генерация персонажей. Допустим, вы хотите сгенерировать изображения персонажей для создаваемой вами игры или графического романа. Крайне сложно заставить генератор изображений с искусственным интеллектом сохранять последовательность черт лица персонажа.

InstantID позволяет генератору изображений ИИ сохранять стилистические и другие функции генерации, сохраняя при этом высокую точность передачи черт лица.

Примеры изображений, созданных на основе одного опорного изображения. Источник: arXiv

InstantID также представляет собой огромный риск. LoRAs - это большая особенность на противоречивые сайты, подобные Civitaiгде пользователи использовали их для создания порно, генерируемого искусственным интеллектом. Сайт пестрит ими, но чтобы сделать достойный LoRA, нужно потрудиться и набраться опыта.

InstantID, вероятно, откроет шлюзы для искусственного интеллекта, потому что для создания реалистичного образа конкретного человека больше не нужны ни LoRA, ни доступ к огромным вычислительным мощностям в облаке. Достаточно одной фотографии.

По досадной иронии судьбы, газета использовала Тейлор Свифт в ряде своих примеров. Шквал подделок Некрасивые изображения Тейлор Свифт которая впоследствии появилась на этой неделе, скорее всего, является признаком грядущих событий.

Команда InstantX отметила, что InstantID позволяет "потенциально создавать оскорбительные или культурно неприемлемые изображения".

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения