Forscher trainieren Modell, um Bilder zu erstellen, ohne urheberrechtlich geschützte Werke zu "sehen

Mai 21, 2024

  • Forscher der University of Texas trainierten ein Bildmodell mit beschädigten Daten
  • Trotz der verzerrten und zerstückelten Bilder ist die Leistung immer noch bewundernswert.
  • Dies zeigt, wie Bilderzeugungsmodelle ohne Copyright-Daten lernen können
Bilderzeugung

Forscher der University of Texas in Austin haben einen innovativen Rahmen für das Training von KI-Modellen auf stark beschädigten Bildern entwickelt. 

Diese als Ambient Diffusion bekannte Methode ermöglicht es KI-Modellen, sich von Bildern "inspirieren" zu lassen ohne sie direkt zu kopieren.

Herkömmliche Text-zu-Bild-Modelle, die von DALL-E, Midjourney und Stable Diffusion riskieren Urheberrechtsverletzungen, weil sie auf Datensätzen trainiert werden, die urheberrechtlich geschützte Bilder enthalten, was dazu führt, dass sie diese Bilder manchmal versehentlich reproduzieren. 

Ambient Diffusion stellt dies auf den Kopf, indem es Modelle mit absichtlich verfälschten Daten trainiert.

In der StudieDas Forschungsteam, dem Alex Dimakis und Giannis Daras von der Abteilung für Elektro- und Computertechnik der UT Austin und Constantinos Daskalakis von der MITtrainierte ein Stable Diffusion XL-Modell auf einem Datensatz von 3.000 Prominentenbildern. 

Zunächst wurde beobachtet, dass die Modelle, die auf sauberen Daten trainiert wurden, ganz offensichtlich die Trainingsbeispiele kopierten. 

Wurden die Trainingsdaten jedoch verfälscht, indem bis zu 90% der Pixel zufällig maskiert wurden, erzeugte das Modell immer noch hochwertige, einzigartige Bilder.

Das bedeutet, dass die KI niemals mit erkennbaren Versionen der Originalbilder in Berührung kommt, was sie daran hindert, diese zu kopieren.

"Unser Rahmen ermöglicht es, den Kompromiss zwischen Auswendiglernen und Leistung zu kontrollieren". erklärte Giannis Daras, ein Doktorand der Informatik, der die Arbeit leitete. 

"Mit zunehmender Korruption während des Trainings nimmt die Merkfähigkeit der Trainingsmenge ab".

Wissenschaftliche und medizinische Anwendungen

Die Einsatzmöglichkeiten von Ambient Diffusion gehen über die Lösung von Urheberrechtsfragen hinaus. 

Laut Professor Adam Klivans, einem Mitarbeiter des Projekts, "könnte sich das System auch für wissenschaftliche und medizinische Anwendungen als nützlich erweisen. Das gilt im Grunde für alle Forschungsarbeiten, bei denen es teuer oder unmöglich ist, über einen vollständigen Satz unverfälschter Daten zu verfügen, von der Abbildung schwarzer Löcher bis hin zu bestimmten Arten von MRT-Scans".

Dies ist besonders vorteilhaft in Bereichen mit begrenztem Zugang zu unverfälschten Daten, wie z. B. Astronomie und Teilchenphysik

In diesen und anderen Bereichen können die Daten extrem verrauscht, von schlechter Qualität oder spärlich sein, was bedeutet, dass sinnvolle Daten durch nutzlose Daten stark in der Minderheit sind. Hier wäre es hilfreich, Modellen beizubringen, suboptimale Daten effizienter zu nutzen.

Wenn der Ambient Diffusion-Ansatz weiter verfeinert würde, könnten KI-Unternehmen funktionale Text-Bild-Modelle erstellen und dabei die Rechte der Urheber von Originalinhalten respektieren und rechtliche Probleme vermeiden.

Das würde zwar nicht die Bedenken ausräumen, dass KI-Bildbearbeitungsprogramme das Arbeitsangebot für echte Künstler einschränken, aber es würde zumindest deren Werke davor schützen, dass sie versehentlich in Ausgaben kopiert werden.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen