Mehr als 16.000 Namen von Künstlern wurden mit der nicht-einvernehmlichen Ausbildung von Midjourneys Bilderzeugungsmodellen in Verbindung gebracht.
Die Midjourney-Künstlerdatenbank ist einer geänderten Klage beigefügt, die gegen Stability AI, DeviantArt und Midjourney eingereicht wurde, abgelegt unter Anhang J, und in einer kürzlich durchgesickerten öffentlichen Google-Tabelle, von der ein Teil in der Internet-Archiv hier.
Der Künstler Jon Lam hat auf X Screenshots aus einem Midjourney-Discord-Chat geteilt, in dem die Entwickler die Verwendung von Künstlernamen und Stilen aus Wikipedia und anderen Quellen diskutieren.
Es wird angenommen, dass die Tabelle ursprünglich vom Midjourney-Entwicklungsteam stammt und passt zu den durchgesickerten Discord-Chats der Midjourney-Entwickler, in denen angedeutet wird, dass die Arbeit des Künstlers auf "Stile" abgebildet wird.
Indem Midjourney die Arbeiten von Künstlern als 'Stile' kodiert, kann Midjourney effizient Arbeiten in deren Stil neu erstellen.
Lam schreibt: "Die Entwickler von Midjourney wurden dabei erwischt, wie sie über Geldwäsche diskutierten und eine Datenbank von Künstlern erstellten (die zu Stilen entmenschlicht wurden)."
Lam veröffentlichte auch Videos mit Listen von Künstlern, einschließlich derer, die für Midjourney Styles verwendet wurden, sowie eine weitere Liste mit "vorgeschlagenen Künstlern". Zahlreiche X-Nutzer gaben an, ihre Namen stünden auf diesen Listen.
Midjourney-Entwickler wurden dabei erwischt, wie sie über Geldwäsche diskutierten und eine Datenbank von Künstlern (die zu Stilen entmenschlicht wurden) anlegten, um Midjourney damit zu trainieren. Dies wurde als Beweis für die Klage eingereicht. Prompte Ingenieure, eure "Fähigkeiten" sind nicht eurehttps://t.co/wAhsNjt5Kz pic.twitter.com/EBvySMQC0P
- Jon Lam #CreateDontScrape (@JonLamArt) 31. Dezember 2023
Ein Screenshot scheint eine Erklärung von Midjourney-CEO David Holz zu zeigen, in der er die Aufnahme von 16.000 Künstlern in das Schulungsprogramm feiert.
Ein anderer zeigt einen Midjourney-Entwickler, der darüber spricht, dass man es durch einen "Codex" "waschen" muss, obwohl es ohne Kontext schwer zu sagen ist, ob sich dies auf die Arbeit der Künstler bezieht.
Andere (nicht Midjourney-Mitarbeiter) wiesen in diesem Gespräch darauf hin, dass die Verarbeitung von Kunstwerken durch ein KI-Modell sie im Wesentlichen vom Urheberrecht entkoppelt.
Der eine sagt: "Man muss nur diese gescrapten Datensätze verwenden, und die vergessen bequemerweise, was man zum Trainieren des Modells verwendet. Bumm, die rechtlichen Probleme sind für immer gelöst."
Wie sich die Rechtsfälle entwickeln
In Gerichtsverfahren gegen Midjourney, Stability AI und auch OpenAI, Meta und Google (allerdings für textbasierte Arbeiten und nicht für Bilder) haben Künstler, Schriftsteller und andere es als schwierig empfunden, zu beweisen, dass ihre Arbeit wirklich wortwörtlich "im" Modell steckt.
Das wäre der schlagende Beweis, den sie brauchen, um Urheberrechtsverletzungen nachzuweisen.
Das Urheberrecht ist in der Ära der KI im Allgemeinen nach wie vor schlecht definiert. KI-Modelle werden auf der Grundlage von Daten trainiert, die irgendwoher kommen müssen, und wo könnte man diese Daten besser finden als im Internet?
Die Entwickler "kratzen" Daten aus dem Internet, die als "offen", "quelloffen" oder "öffentlich" bezeichnet werden, aber auch hier sind diese Begriffe nur unzureichend definiert. Man könnte sagen, dass die KI-Entwickler, als sie den bevorstehenden Goldrausch witterten, so viele "offene" Daten aus dem Internet wie möglich beschlagnahmten und diese zum Trainieren ihrer Modelle verwendeten.
Juristische Verfahren sind langsam; KI ist im Vergleich dazu blitzschnell. Es war für Entwickler sehr einfach, das Urheberrecht zu umgehen und Modelle zu trainieren, lange bevor die Urheberrechtsinhaber und das Gesetz zum Schutz des geistigen Eigentums reagieren konnten.
Der Reaktionsprozess ist nun im Gange, aber sowohl der KI-Trainingsprozess als auch der technische Prozess, der mit der Erzeugung von KI-Outputs (z. B. Text oder Bilder) aus Benutzereingaben verbunden ist, stellen das Recht des geistigen Eigentums in Frage.
Insbesondere ist es a) schwer zu beweisen, dass KI-Modelle definitiv auf urheberrechtlich geschütztem Material trainiert wurden, und b) schwer zu beweisen, dass ihre Ergebnisse urheberrechtlich geschütztes Material ausreichend wiedergeben.
Außerdem stellt sich die Frage der Rechenschaftspflicht. KI-Unternehmen wie OpenAI und Midjourney haben zumindest teilweise Daten verwendet, die von anderen gesammelt wurden, anstatt sie selbst zu sammeln. Wären dann nicht die ursprünglichen Datensammler für Verstöße verantwortlich?
Im Zusammenhang mit der jüngsten Situation bei Midjourney ist festzustellen, dass die Modelle von Midjourney, wie andere auch, immer eine Mischung der in ihren Daten enthaltenen Werke wiedergeben. Die Künstler können nicht ohne weiteres nachweisen, welche Stücke sie verwendet haben.
Zum Beispiel, als kürzlich ein Urheberrechtsverfahren gegen Midjourney, Stability AI und DeviantArt wurde entlassen (es ist seit wurde wiedervorgelegt mit neuen Klägern), stellte Bundesrichter Orrick mehrere Mängel bei der Formulierung der Ansprüche fest, insbesondere beim Verständnis der Funktionsweise von KI-Bildgeneratoren.
In der ursprünglichen Klage wurde behauptet, dass Stability AI beim Training seines Stable Diffusion-Modells komprimierte Kopien der Bilder gespeichert hat.
Stability AI widerlegte dies und stellte klar, dass der Trainingsprozess die Extraktion von Attributen wie Linien, Schattierungen und Farben und die Entwicklung von Parametern auf der Grundlage dieser Attribute beinhaltet, anstatt Kopien der Bilder zu speichern.
Das Urteil von Orrick unterstreicht die Notwendigkeit für die Klägerinnen, ihre Forderungen zu ändern, um die Funktionsweise dieser KI-Modelle genauer darzustellen.
Dazu gehört auch die Notwendigkeit einer klareren Erklärung, ob die Klage gegen Midjourney auf die Nutzung von Stable Diffusion, die unabhängige Nutzung von Trainingsbildern oder beides zurückzuführen ist (da Midjourney auch beschuldigt wird, die Modelle von Stability AI zu nutzen, die angeblich urheberrechtlich geschützte Werke verwenden).
Eine weitere Herausforderung für die Kläger ist der Nachweis, dass die Ergebnisse von Midjourney ihren ursprünglichen Kunstwerken im Wesentlichen ähnlich sind. Orrick merkte an, dass die Kläger selbst zugaben, dass die von Stable Diffusion ausgegebenen Bilder wahrscheinlich keinem bestimmten Bild in den Trainingsdaten sehr ähnlich sind.
Ab sofort, der Fall ist lebendigDas Gericht wies die jüngsten Versuche der KI-Unternehmen zurück, die Klagen der Künstler abzuweisen.
Die Techbros von Gen Ai möchten Sie glauben machen, dass die Klage tot ist oder abgewiesen wurde. Nein, die Klage ist immer noch lebendig und gut, und es wurden weitere Beweise und Kläger zu den Akten hinzugefügt.
Aktualisiertes Casefile hier.https://t.co/uTqs6grWRE
- Jon Lam #CreateDontScrape (@JonLamArt) 2. Januar 2024
.
Nutzung des LAION-Datensatzes in den Mix geworfen
Die gegen Midjourney und Co. eingereichten Klagen betrafen auch die potenzielle Nutzung des LAION-5B-Datensatzes, einer Zusammenstellung von 5,85 Milliarden Bildern aus dem Internet, einschließlich urheberrechtlich geschützter Inhalte.
Stanford hat LAION kürzlich verurteilt weil sie unerlaubte sexuelle Bilder enthalten, darunter sexueller Missbrauch von Kindern und verschiedene sexistische, rassistische und anderweitig verwerfliche Inhalte - all das "lebt" jetzt auch in den KI-Modellen, auf die sich die Gesellschaft für kreative und berufliche Zwecke zu verlassen beginnt.
Die langfristigen Auswirkungen sind umstritten, aber die Tatsache, dass diese KI möglicherweise erstens auf gestohlene Arbeiten und zweitens auf illegale Inhalte trainiert wird, wirft kein gutes Licht auf die KI-Entwicklung im Allgemeinen.
Die Kommentare der Midjourney-Entwickler wurden in den sozialen Medien stark kritisiert und das Y Combinator-Forum.
Es ist sehr wahrscheinlich, dass das Jahr 2024 weitere hitzige juristische Debatten auslösen wird, und das Wildwest-Kapitel der KI-Entwicklung könnte sich seinem Ende nähern.