InstantID genererer reproduktioner fra et enkelt ansigtsbillede

31. januar 2024

AI-værktøjer kan skabe billeder af personlige digitale identiteter, men det kræver, at man finjusterer LoRA'er for at få gode resultater. InstantID er et zero-shot-plugin, der gør det muligt for generative AI-modeller at lave ensartede billeder ved hjælp af et enkelt referenceansigtsbillede.

For at få en generativ model til at skabe konsistente, sammenhængende billeder af en bestemt person skal man som regel bruge en LoRA.

LoRA, en forkortelse for Low-Rank Adaptation, er en teknik, der bruges til at tilpasse billedgenereringsmodeller uden at omskole dem helt. Hvis du ville gøre din model rigtig god til at lave billeder af Taylor Swift, ville du lave en LoRA, der var finjusteret på en masse billeder af hende.

Det tager tid at lave en LoRA, det kræver en masse referencebilleder og masser af ressourcer. InstantID ændrer alt dette og kan betyde enden på LoRA'er for mange applikationer.

InstantX-teamet skabte InstantID, en nul-shot-model, der ikke kræver træning eller finjustering. Med et enkelt ansigt som reference kan InstantID gøre det muligt for en tekst-til-billede Stable Diffusion-model som SD1.5 eller SDXL at skabe flere billeder af personen.

Den bruger en IdentityNet-komponent, der fokuserer stærkt på specifikke ansigtselementer i referencebilledet i stedet for andre elementer i referencebilledet.

En af de store fordele ved InstantID er konsekvent karaktergenerering. Lad os sige, at du vil generere billeder af en karakter i et spil eller en grafisk roman, du er ved at lave. Det er ekstremt svært at få en AI-billedgenerator til at opretholde konsistens i karakterens ansigtstræk.

InstantID gør det muligt for en AI-billedgenerator at bevare sin stilistiske og andre generative funktioner, samtidig med at ansigtstrækkene bevares i høj kvalitet.

Eksempler på billeder genereret ud fra et enkelt referencebillede. Kilde: arXiv

InstantID introducerer også store risici. LoRA'er er en stor del af kontroversielle steder som Civitaihvor brugerne kunne bruge dem til at skabe AI-genereret porno. Siden er fyldt med dem, men det kræver arbejde og ekspertise at lave en god LoRA.

InstantID vil sandsynligvis åbne sluserne for AI-fup, fordi man ikke længere behøver en LoRA eller adgang til masser af cloud computing-kraft for at skabe et realistisk billede af en bestemt person. Et foto er alt, hvad der skal til.

I et tilfælde af uheldig ironi brugte avisen Taylor Swift i en række af sine eksempelbilleder. Strømmen af falske NSFW-billeder af Taylor Swift som efterfølgende gik sin sejrsgang i denne uge, er sandsynligvis et tegn på, hvad der skal ske.

InstantX-teamet bemærkede, at InstantID muliggør "den potentielle skabelse af stødende eller kulturelt upassende billeder."

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser