Las herramientas de IA pueden crear imágenes de identidades digitales personalizadas, pero eso implica afinar los LoRA para obtener buenos resultados. InstantID es un complemento de disparo cero que permite a los modelos generativos de IA crear imágenes coherentes utilizando una única imagen facial de referencia.
Para conseguir que un modelo generativo cree imágenes coherentes y consistentes de una persona concreta, generalmente es necesario utilizar un LoRA.
LoRA, abreviatura de Low-Rank Adaptation (adaptación de bajo rango), es una técnica utilizada para adaptar modelos de generación de imágenes, sin reentrenarlos completamente. Si quisieras que tu modelo fuera realmente bueno generando imágenes de Taylor Swift, crearías un LoRA ajustado a un montón de imágenes de ella.
Crear el LoRA lleva tiempo, muchas imágenes de referencia y muchos recursos de procesamiento. InstantID cambia todo esto y podría suponer el fin de los LoRA para muchas aplicaciones.
El equipo de InstantX creó InstantID, un modelo de cero disparos que no requiere entrenamiento ni ajuste. Con un solo rostro como referencia, InstantID puede habilitar un modelo de difusión estable de texto a imagen como SD1.5 o SDXL para crear más imágenes de la persona.
¡Por fin ha salido InsantID! Consulte el artículo para obtener más información. El código y los modelos preentrenados se publicarán este mes.
Papel: https://t.co/Oy4HtmdeGu
Página del proyecto: https://t.co/gsZE5Q88jg
Código: https://t.co/FlqTknoTxG pic.twitter.com/HiFUkOSYlB
- Frank (Haofan) Wang (@Haofan_Wang) 17 de enero de 2024
Utiliza un componente IdentityNet que se centra más en elementos faciales específicos de la imagen de referencia que en otros elementos de la misma.
Una de las grandes ventajas de InstantID es la coherencia en la generación de personajes. Supongamos que quieres generar imágenes de un personaje para un juego o una novela gráfica. Es extremadamente difícil conseguir que un generador de imágenes de IA mantenga la coherencia en los rasgos faciales del personaje.
InstantID permite que un generador de imágenes de IA mantenga su funcionalidad estilística y otras funciones generativas al tiempo que conserva rasgos faciales de alta fidelidad.
InstantID también introduce grandes riesgos. Los LoRA son una característica importante en sitios controvertidos como Civitaidonde los usuarios los utilizaban para crear porno generado por IA. El sitio está plagado de ellos, pero se necesita trabajo y experiencia para hacer un LoRA decente.
Es probable que InstantID abra las compuertas de la falsificación por IA, porque ya no se necesita una LoRA ni acceso a montones de potencia de computación en la nube para crear una imagen realista de una persona concreta. Basta con una foto.
En un caso de desafortunada ironía, el periódico utilizó a Taylor Swift en varias de sus imágenes de ejemplo. La oleada de falsificaciones Imágenes NSFW de Taylor Swift que ha circulado esta semana es probablemente una señal de lo que está por venir.
El equipo de InstantX señaló que InstantID permite "la creación potencial de imágenes ofensivas o culturalmente inapropiadas".