InstantID genera riproduzioni a partire da un'unica immagine del volto.

31 gennaio 2024

Gli strumenti di intelligenza artificiale possono creare immagini di identità digitali personalizzate, ma ciò comporta una messa a punto dei LoRA per ottenere buoni risultati. InstantID è un plugin a scatto zero che consente ai modelli di IA generativa di creare immagini coerenti utilizzando un'unica immagine del volto di riferimento.

Per far sì che un modello generativo crei immagini coerenti di una persona specifica è generalmente necessario utilizzare un LoRA.

LoRA, acronimo di Low-Rank Adaptation (adattamento a basso rango), è una tecnica utilizzata per adattare i modelli di generazione di immagini, senza riqualificarli completamente. Se si volesse rendere il proprio modello molto bravo a creare immagini di Taylor Swift, si creerebbe un LoRA ottimizzato su un gruppo di immagini di lei.

La creazione di LoRA richiede tempo, molte immagini di riferimento e molte risorse di elaborazione. InstantID cambia tutto questo e potrebbe segnare la fine dei LoRA per molte applicazioni.

Il team InstantX ha creato InstantID, un modello a scatto zero che non richiede formazione o messa a punto. Con un singolo volto come riferimento, InstantID può abilitare un modello di diffusione stabile da testo a immagine come SD1.5 o SDXL per creare più immagini della persona.

Utilizza un componente IdentityNet che si concentra fortemente su elementi facciali specifici dell'immagine di riferimento piuttosto che su altri elementi dell'immagine di riferimento.

Uno dei grandi vantaggi di InstantID è la generazione coerente dei personaggi. Supponiamo che vogliate generare le immagini di un personaggio di un gioco o di una graphic novel che state realizzando. È estremamente difficile far sì che un generatore di immagini AI mantenga la coerenza dei tratti facciali del personaggio.

InstantID consente a un generatore di immagini AI di mantenere la sua funzionalità stilistica e altre funzionalità generative, pur conservando i tratti del viso ad alta fedeltà.

Esempi di immagini generate da una singola immagine di riferimento. Fonte: arXiv

InstantID introduce anche rischi enormi. I LoRA sono una caratteristica importante di siti controversi come Civitaidove gli utenti li usavano per creare porno generati dall'intelligenza artificiale. Il sito ne è pieno, ma ci vuole lavoro e competenza per creare un LoRA decente.

InstantID probabilmente aprirà le porte ai falsi AI perché non è più necessario un LoRA o l'accesso a grandi quantità di potenza di calcolo cloud per creare un'immagine realistica di una persona specifica. Basta una foto.

In un caso di sfortunata ironia, il giornale ha utilizzato Taylor Swift in alcune delle sue immagini di esempio. La raffica di falsi Immagini NSFW di Taylor Swift che ha fatto il giro questa settimana è probabilmente un segno di ciò che accadrà.

Il team InstantX ha notato che InstantID consente "la potenziale creazione di immagini offensive o culturalmente inappropriate".

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Eugene van der Watt

Eugene proviene da un background di ingegneria elettronica e ama tutto ciò che è tecnologico. Quando si prende una pausa dal consumo di notizie sull'intelligenza artificiale, lo si può trovare al tavolo da biliardo.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni