InstantID erzeugt Reproduktionen aus einem einzigen Gesichtsbild

31. Januar 2024

KI-Tools können Bilder von personalisierten digitalen Identitäten erstellen, aber das erfordert eine Feinabstimmung der LoRAs, um gute Ergebnisse zu erzielen. InstantID ist ein Zero-Shot-Plugin, das es generativen KI-Modellen ermöglicht, anhand eines einzigen Referenzgesichtsbildes konsistente Bilder zu erstellen.

Um ein generatives Modell dazu zu bringen, konsistente, kohärente Bilder einer bestimmten Person zu erstellen, müssen Sie im Allgemeinen eine LoRA verwenden.

LoRA, die Abkürzung für Low-Rank Adaptation, ist eine Technik zur Anpassung von Bilderzeugungsmodellen, ohne sie vollständig neu zu trainieren. Wenn Sie Ihr Modell wirklich gut darin machen wollten, Bilder von Taylor Swift zu erstellen, würden Sie eine LoRA erstellen, die mit einer Reihe von Bildern von ihr fein abgestimmt ist.

Die Erstellung von LoRAs erfordert Zeit, eine Menge Referenzbilder und jede Menge Verarbeitungsressourcen. InstantID ändert all das und könnte das Ende von LoRAs für viele Anwendungen bedeuten.

Das InstantX-Team hat InstantID entwickelt, ein Zero-Shot-Modell, das weder Training noch Feinabstimmung erfordert. Mit einem einzigen Gesicht als Referenz kann InstantID ein Text-zu-Bild-Stable-Diffusion-Modell wie SD1.5 oder SDXL aktivieren, um weitere Bilder der Person zu erstellen.

Es verwendet eine IdentityNet-Komponente, die sich stark auf bestimmte Gesichtselemente im Referenzbild konzentriert und nicht auf andere Elemente im Referenzbild.

Einer der großen Vorteile von InstantID ist die konsistente Charaktererstellung. Nehmen wir an, Sie wollten Bilder einer Figur für ein Spiel oder einen grafischen Roman generieren, an dem Sie arbeiten. Es ist extrem schwierig, einen KI-Bildgenerator dazu zu bringen, die Konsistenz der Gesichtszüge der Figur zu erhalten.

InstantID ermöglicht es einem KI-Bildgenerator, seine stilistischen und anderen generativen Funktionen beizubehalten und gleichzeitig die Gesichtszüge originalgetreu wiederzugeben.

Beispiele für Bilder, die aus einem einzigen Referenzbild erzeugt wurden. Quelle: arXiv

InstantID birgt auch große Risiken. LoRAs sind ein wichtiges Merkmal von umstrittene Websites wie Civitaiauf, wo die Nutzer sie zur Erstellung von KI-generierten Pornos verwenden. Die Website ist voll davon, aber es erfordert Arbeit und Fachwissen, um eine anständige LoRA zu erstellen.

InstantID wird wahrscheinlich die Schleusen für KI-Fälschungen öffnen, denn man braucht keine LoRA mehr und auch keinen Zugang zu Unmengen von Cloud-Rechenleistung, um ein realistisches Bild einer bestimmten Person zu erstellen. Ein Foto ist alles, was man braucht.

In einem Fall von unglücklicher Ironie verwendete die Zeitung Taylor Swift in einer Reihe ihrer Beispielbilder. Die Aufregung um gefälschte NSFW Taylor Swift Bilder die in dieser Woche die Runde machte, ist wahrscheinlich ein Zeichen für die Zukunft.

Das InstantX-Team stellte fest, dass InstantID "die potenzielle Erstellung von anstößigen oder kulturell unangemessenen Bildern" ermöglicht.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Eugene van der Watt

Eugene kommt aus der Elektronikbranche und liebt alles, was mit Technik zu tun hat. Wenn er eine Pause vom Konsum von KI-Nachrichten einlegt, findet man ihn am Snookertisch.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen