InstantID genererer reproduksjoner fra ett enkelt ansiktsbilde

31. januar 2024

AI-verktøy kan lage bilder av personlige digitale identiteter, men det innebærer finjustering av LoRA-er for å få gode resultater. InstantID er en null-shot-plugin som gjør det mulig for generative AI-modeller å lage konsistente bilder ved hjelp av ett enkelt referansebilde av ansiktet.

For å få en generativ modell til å skape konsistente, sammenhengende bilder av en bestemt person, må du vanligvis bruke en LoRA.

LoRA, en forkortelse for Low-Rank Adaptation, er en teknikk som brukes til å tilpasse bildegenereringsmodeller uten å omskolere dem fullstendig. Hvis du ville gjøre modellen din virkelig god til å lage bilder av Taylor Swift, ville du laget en LoRA finjustert på en haug med bilder av henne.

Det tar tid å lage en LoRA, og det krever mange referansebilder og store prosesseringsressurser. InstantID endrer alt dette og kan bety slutten på LoRA for mange applikasjoner.

InstantX-teamet har utviklet InstantID, en null-bilde-modell som ikke krever noen opplæring eller finjustering. Med ett enkelt ansikt som referanse kan InstantID aktivere en tekst-til-bilde-modell med stabil diffusjon, som SD1.5 eller SDXL, for å skape flere bilder av personen.

Den bruker en IdentityNet-komponent som fokuserer sterkt på spesifikke ansiktselementer i referansebildet i stedet for på andre elementer i referansebildet.

En av de store fordelene med InstantID er konsekvent karaktergenerering. La oss si at du ønsker å generere bilder av en figur i et spill eller en grafisk roman du holder på å lage. Det er ekstremt vanskelig å få en AI-bildegenerator til å opprettholde konsistens i karakterens ansiktstrekk.

InstantID gjør det mulig for en AI-bildegenerator å opprettholde stilistiske og andre generative funksjoner, samtidig som ansiktstrekkene bevares med høy troskap.

Eksempler på bilder generert fra ett enkelt referansebilde. Kilde: arXiv

InstantID innebærer også en stor risiko. LoRA er en stor funksjon på kontroversielle nettsteder som Civitaihvor brukere ville bruke dem til å lage AI-generert porno. Nettstedet er fullt av dem, men det krever arbeid og ekspertise for å lage en anstendig LoRA.

InstantID vil sannsynligvis åpne slusene for AI-falsk, fordi du ikke lenger trenger en LoRA eller tilgang til massevis av datakraft i skyen for å skape et realistisk bilde av en bestemt person. Ett bilde er alt som trengs.

I et tilfelle av uheldig ironi brukte avisen Taylor Swift i en rekke av sine eksempelbilder. Strømmen av falske NSFW-bilder av Taylor Swift som senere denne uken har gått sin seiersgang, er sannsynligvis et tegn på hva som kommer til å skje.

InstantX-teamet bemerket at InstantID muliggjør "potensiell opprettelse av støtende eller kulturelt upassende bilder".

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser