InstantID genera reproducciones a partir de una sola imagen facial

31 de enero de 2024

Las herramientas de IA pueden crear imágenes de identidades digitales personalizadas, pero eso implica afinar los LoRA para obtener buenos resultados. InstantID es un complemento de disparo cero que permite a los modelos generativos de IA crear imágenes coherentes utilizando una única imagen facial de referencia.

Para conseguir que un modelo generativo cree imágenes coherentes y consistentes de una persona concreta, generalmente es necesario utilizar un LoRA.

LoRA, abreviatura de Low-Rank Adaptation (adaptación de bajo rango), es una técnica utilizada para adaptar modelos de generación de imágenes, sin reentrenarlos completamente. Si quisieras que tu modelo fuera realmente bueno generando imágenes de Taylor Swift, crearías un LoRA ajustado a un montón de imágenes de ella.

Crear el LoRA lleva tiempo, muchas imágenes de referencia y muchos recursos de procesamiento. InstantID cambia todo esto y podría suponer el fin de los LoRA para muchas aplicaciones.

El equipo de InstantX creó InstantID, un modelo de cero disparos que no requiere entrenamiento ni ajuste. Con un solo rostro como referencia, InstantID puede habilitar un modelo de difusión estable de texto a imagen como SD1.5 o SDXL para crear más imágenes de la persona.

Utiliza un componente IdentityNet que se centra más en elementos faciales específicos de la imagen de referencia que en otros elementos de la misma.

Una de las grandes ventajas de InstantID es la coherencia en la generación de personajes. Supongamos que quieres generar imágenes de un personaje para un juego o una novela gráfica. Es extremadamente difícil conseguir que un generador de imágenes de IA mantenga la coherencia en los rasgos faciales del personaje.

InstantID permite que un generador de imágenes de IA mantenga su funcionalidad estilística y otras funciones generativas al tiempo que conserva rasgos faciales de alta fidelidad.

Ejemplos de imágenes generadas a partir de una única imagen de referencia. Fuente: arXiv

InstantID también introduce grandes riesgos. Los LoRA son una característica importante en sitios controvertidos como Civitaidonde los usuarios los utilizaban para crear porno generado por IA. El sitio está plagado de ellos, pero se necesita trabajo y experiencia para hacer un LoRA decente.

Es probable que InstantID abra las compuertas de la falsificación por IA, porque ya no se necesita una LoRA ni acceso a montones de potencia de computación en la nube para crear una imagen realista de una persona concreta. Basta con una foto.

En un caso de desafortunada ironía, el periódico utilizó a Taylor Swift en varias de sus imágenes de ejemplo. La oleada de falsificaciones Imágenes NSFW de Taylor Swift que ha circulado esta semana es probablemente una señal de lo que está por venir.

El equipo de InstantX señaló que InstantID permite "la creación potencial de imágenes ofensivas o culturalmente inapropiadas".

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Eugene van der Watt

Eugene es ingeniero electrónico y le encanta todo lo relacionado con la tecnología. Cuando descansa de consumir noticias sobre IA, lo encontrará jugando al billar.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales