Einblick in den Kampf zwischen Künstlern und KI-Bildgeneratoren

5. August 2023

AI-Gesetz

Künstler und Kunstschaffende machen den KI-Entwicklern wegen möglicher Urheberrechtsverletzungen das Leben schwer.

Geben Sie eine Eingabeaufforderung in einen KI-Bildgenerator wie DALL-E, MidJourney oder Stable Diffusion ein, und er wird innerhalb weniger Sekunden ein scheinbar einzigartiges Bild erzeugen.

Trotz ihrer offensichtlichen Einzigartigkeit, tiese Bilder werden aus Milliarden anderer Bilder durch eine komplexe digitale Collagierungstechnik erzeugt.

Die Quellbilder stammen aus "öffentlichen" oder "offenen" Quellen. 

Wenn du ChatGPT fragst, wie ein Bildgenerator wie DALL-E funktioniert, wird es etwa Folgendes sagen: "Stell dir DALL-E wie einen hochentwickelten digitalen Künstler vor, der Millionen von Bildern gesehen hat und auf der Grundlage deiner Beschreibung ein neues Bild zeichnen kann, wobei er versucht, es so genau wie möglich zu machen. Er tut dies, indem er Elemente, die er aus seinen früheren 'Beobachtungen' gelernt hat, mischt und kombiniert."

Es ist ein bisschen so, als würde man durch die Kunstgalerien der Welt streifen und jedes Werk fotografieren - nur dass man nicht rausgeschmissen werden kann. 

Im Internet gibt es keine Sicherheitskräfte und Kameras, die die Menschen überwachen, um Piraterie oder Diebstahl zu verhindern, und die Praxis des Data Scraping - also das Sammeln von Daten aus dem Internet mit Hilfe von Bots - war schon immer ein rechtlich unklares Terrain. 

Künstler argumentieren, dass das Training von Text-Bild-KI auf öffentlichen Datensätzen dem größten Kunstraub der Welt gleichkommt.

Wie fühlen sich Künstler bei KI-Detektoren?

Für einige erfolgreiche Künstler, deren Werke tausend- oder sogar millionenfach kopiert wurden, haben die Auswirkungen der KI-generierten Kunst es schwierig gemacht, zwischen ihren eigenen Werken und KI-Kopien zu unterscheiden.

Die ästhetischen Unterschiede sind einfach zu gering, wahrscheinlich, weil populäre Bilder in den Datensätzen sehr häufig vorkommen. 

Einer von ihnen ist Greg Rutowski, der sagte: "Meine Arbeit wurde in der KI mehr verwendet als Picasso." 

Greg Rutowski
Greg Rutowskis Arbeit wurde bereits tausendfach kopiert: Quelle: MIT.

Rutowkis Fantasy-Illustrationen finden sich in Franchises wie Dungeons and Dragons und Magic: The Gathering und können über Text-Bild-Generatoren nachgebildet werden, indem man einfach den Namen des Künstlers an die Eingabeaufforderung anhängt, z. B. "Erstelle einen Drachen, der gegen einen Oger kämpft, im Stil von Greg Rutowski". 

Er sagte der BBCIm ersten Monat, in dem ich es entdeckte, wurde mir klar, dass es sich eindeutig auf meine Karriere auswirken wird und ich nicht in der Lage sein werde, meine eigenen Werke im Internet zu erkennen und zu finden", und fügte hinzu: "Die Ergebnisse werden mit meinem Namen in Verbindung gebracht, aber es wird nicht mein Bild sein. Es wird nicht von mir geschaffen sein. Das wird die Leute, die meine Werke entdecken, nur verwirren."

Er fuhr fort: "All das, woran wir so viele Jahre gearbeitet haben, wird uns durch die KI so leicht genommen." 

Die letzte Aussage trifft den Nagel auf den Kopf, denn die Reproduktion komplexer, talentierter Werke durch die KI dauert nur wenige Sekunden, was bedeutet, dass nicht nur die Arbeit von Künstlern überflüssig wird, sondern auch die Fähigkeiten, die zu ihrer Erstellung erforderlich waren, verloren gehen.

Die MenschheitDer Mangel an authentischen Fähigkeiten und Kenntnissen ist eines der größten Risiken der KI, das als "Entkräftung,"Das Beispiel des Disney-Films WALL-E zeigt, dass der Mensch durch die Technik die Fähigkeit verliert, sich zu bewegen. 

Eine weitere Künstlerin, die sich über die Vervielfältigung ihrer Werke durch KI geäußert hat, ist Kelly McKernan, eine Illustratorin aus Tennessee, die feststellte, dass mehr als 50 ihrer Kunstwerke als Trainingsdaten im Large-scale Artificial Intelligence Open Network (LAION) aufgeführt waren.

Mit dem Tool " können Sie rund 5,8 Milliarden Bilder aus KI-Trainingssets durchsuchen.Wurde ich geschult?"So ist McKernan auf ihre Arbeit gestoßen. 

Wurde ich geschult? bietet eine Möglichkeit zur Suche in Open-Source-Bilddatenbanken.

LAION ist eine Non-Profit-Organisation, die Open-Source-Modelle und -Datensätze erstellt, von denen viele zum Trainieren hochkarätiger Text-Bild-Modelle verwendet wurden, darunter Stable Diffusion und Imagen.

"Plötzlich bekamen all diese Gemälde, zu denen ich eine persönliche Beziehung hatte und mit denen ich eine Reise unternommen hatte, eine neue Bedeutung, was meine Beziehung zu diesen Kunstwerken veränderte", sagte McKernan.

Rechtliche Auseinandersetzungen sind im Gange 

McKernan hat zusammen mit seinen Künstlerkolleginnen Sarah Anderson und Karla Ortiz rechtliche Schritte gegen Stability AI, DeviantArt und Midjourney eingeleitet.

Ihre Klage reiht sich ein in eine Flut von Klagen gegen KI-Unternehmen, die sowohl von Schriftstellern als auch von bildenden Künstlern angestrengt werden. 

Auch größere Unternehmen verklagen oder planen, KI-Entwickler zu verklagen, darunter Getty Images, das behauptet, Stability AI habe 12 Millionen seiner Bilder ohne Genehmigung kopiert und verarbeitet.

McKernan sagte: "So wie es ist, kann das Urheberrecht nur auf mein komplettes Bild angewendet werden. Ich hoffe, dass sie [die Klage] den Schutz von Künstlern fördert, damit KI nicht dazu benutzt werden kann, uns zu ersetzen. Wenn wir gewinnen, hoffe ich, dass viele Künstler bezahlt werden. Es handelt sich um freie Arbeit, und einige Leute profitieren davon, sie auszubeuten."

McKernans Stil, der unten zu sehen ist, wurde in etwa 12.000 MidJourney-Aufforderungen angefordert. 

 

Diesen Beitrag auf Instagram anzeigen

 

Ein Beitrag geteilt von Kelly McKernan (@kelly_mckernan)

Ein grundlegendes Problem dabei ist, dass das Urheberrecht einfach nicht für das Zeitalter der KI geschaffen wurde.

Liam Budd von der Gewerkschaft der darstellenden Künste und der Unterhaltungsindustrie (Equity) plädierte für aktualisierte Gesetze, die die potenziellen Geschäftsmöglichkeiten der generativen KI widerspiegeln. 

Er erklärteWir brauchen mehr Klarheit im Gesetz und setzen uns für eine Aktualisierung des Urheberrechtsgesetzes ein.

Als Reaktion auf die wachsende Flut von Urheberrechtsverletzungen durch KI haben verschiedene Länder, wie z. B. die EU, vorgeschlagen, dass KI-Entwickler urheberrechtlich geschütztes Material, das für das Training verwendet wird, offenlegen müssen. 

Wird das ausreichen? Haben die KI-Entwickler bereits gezeigt, dass sie wahrscheinlich damit durchkommen werden?

Schließlich sind die meisten dieser Datensätze bereits zusammengestellt, und die KI-Unternehmen könnten argumentieren, dass sie lediglich ihre Modelle aktualisieren, um die Notwendigkeit zu umgehen, urheberrechtlich geschütztes Material zu deklarieren.

Stehen die Klagen auf einer soliden rechtlichen Grundlage?

Diese aktuelle Runde von Sammelklagen dreht sich im Wesentlichen um zwei Argumente. 

  • Erstens die Behauptung, dass die Unternehmen die Urheberrechte von Künstlern verletzen, indem sie deren Werke ohne Genehmigung verwenden. 
  • Zweitens die Behauptung, dass die KI-Ergebnisse aufgrund ihrer Einbeziehung in die Trainingsdaten im Wesentlichen abgeleitete Inhalte sind. 

Diese Argumente werden weltweit unterschiedlich angewandt, z. B. in den USA, wo die "Fair Use"-Gesetze im Allgemeinen liberaler sind als in der EU. Dies macht die KI-Urheberrechtslandschaft noch komplizierter. Für Unternehmen, die beispielsweise im Vereinigten Königreich tätig sind, kann es schwieriger sein, "fair use" zu argumentieren.

Außerdem werden die Unternehmen der generativen KI verklagt und nicht die Unternehmen, die die Datensätze erstellen, wie LAION im Fall von MidJourney. Eliana Torres, Anwältin für geistiges Eigentum bei der Anwaltskanzlei Nixon Peabody, weist darauf hin, dass, wenn LAION den Datensatz erstellt hat, die angebliche Rechtsverletzung zu diesem Zeitpunkt stattfand und nicht, als der Datensatz zum Trainieren der Modelle verwendet wurde.

Der Nachweis, dass es sich bei den von der KI generierten Werken um Reproduktionen von Originalwerken handelt, ist eine Herausforderung, da die KI komplexe Algorithmen verwendet, um Bilder zu zerlegen und neu zusammenzusetzen.

Die Regulierungsbehörden wurden von den rechtlichen Auswirkungen der generativen KI überrascht, und obwohl Zwischenlösungen wie automatische Filter und Opt-out-Bestimmungen für Künstler entwickelt werden, sind sie möglicherweise nicht ausreichend. 

Bis die Richter in einzelnen Fällen zu einem Urteil kommen, was Monate dauern kann, setzen sich generative KI-Firmen in vielen Gerichtsbarkeiten erheblichen rechtlichen Risiken aus. 

Die Geschichte zeigt, dass sich das Urheberrecht an neue Technologien anpassen kann, aber bis sich ein Konsens abzeichnet, tappen sowohl Künstler als auch KI-Entwickler im Dunkeln. 

Richter schränken Klagen ein

Bislang haben die Richter den Künstlern wenig Anlass zum Optimismus gegeben. 

So hat beispielsweise der US-Bezirksrichter William Orrick die Klage von Kelly McKernan in Zweifel gezogen.

Nach Ansicht von Richter OrrickMcKernan und die anderen Kläger müssten "mehr Fakten" über die angebliche Urheberrechtsverletzung vorlegen und ihre Ansprüche gegen die einzelnen Unternehmen (Stability AI, DeviantArt und Midjourney) klar abgrenzen. 

Orrick wies darauf hin, dass die Systeme auf "fünf Milliarden komprimierte Bilder" trainiert worden seien, so dass die Künstler stärkere Beweise dafür vorlegen müssten, dass ihre Werke konkret in die mutmaßliche Urheberrechtsverletzung involviert waren. A Website zur Verfolgung dieses Prozesses hat vor kurzem technische Informationen darüber veröffentlicht, wie diese Modelle funktionieren, indem sie Inhalte von Bildern aus ihrem Trainingssatz interpolieren. 

Der Fall wird vertreten durch die Anwaltskanzlei Joseph Saveridie auch mindestens 5 weitere ähnliche Fälle gegen KI-Unternehmen vertritt.

Und auch hier wird das Urheberrecht möglicherweise eher bei der Datenerfassung als bei der Datenerzeugung verletzt. 

In Abschnitt 1202(b) des amerikanischen Digital Millennium Copyright Act "geht es um identische 'Kopien ... eines Werks' - nicht um verstreute Schnipsel und Anpassungen" - die Behauptung, dass Werke durch den Prozess des KI-Modells 'kopiert' werden, ist potenziell fadenscheinig. 

Orricks Ansichten werfen auch Fragen über die Haftung von Unternehmen wie MidJourney und DeviantArt auf, die die Stable Diffusion-Technologie von Stability AI in ihre eigenen generativen KI-Systeme integrieren. 

IWenn KI-Entwickler wie OpenAI, Meta usw. eine gewisse Haftung für die Verletzung der Urheberrechte von Künstlern erhalten, sind sie anfällig für weitere rechtliche Schritte. 

Auch Autoren und Schriftsteller führen Rechtsstreitigkeiten 

In einem anderen aktueller RechtsstreitDie US-Komikerin und Autorin Sarah Silverman und die Autoren Christopher Golden und Richard Kadrey behaupten, dass ihre Worte unrechtmäßig zum Trainieren von KI-Modellen wie ChatGPT und LLaMA verwendet wurden.

Die Klage erhebt ähnliche Ansprüche wie die von bildenden Künstlern, aber diesmal werden die KI auf öffentliche Textdaten trainiert. 

In der Klage wird behauptet, dass ChatGPT in der Lage war, Bücher wie "The Bedwetter" von Silverman, "Ararat" von Golden und "Sandman Slim" von Kadrey genau zusammenzufassen. Entscheidend ist, dass der Detaillierungsgrad der Zusammenfassungen nicht durch Auszüge aus den Büchern erklärt werden kann, die auf Wikipedia oder Buchhandelswebsites hochgeladen wurden. 

Die Kläger beschuldigen OpenAI und Meta, urheberrechtlich geschützte Bücher aus "Schattenbibliotheken" ohne Zustimmung zu verwenden. 

Schattenbibliotheken wie Bibliotik, Library Genesis und Z-Library beherbergen große Mengen an illegal kopierten Informationen. 

Bibliothek
Die Bibliothek Genesis war bereits zuvor mit rechtlichen Schritten konfrontiert und wurde aufgefordert, ihre Website zu schließen, aber die Organisatoren eröffneten einfach neue Domains. Quelle: Wikipedia.

Es ist zwar offensichtlich, dass KI-Unternehmen Produkte mit Hilfe urheberrechtlich geschützter Werke monetarisieren, aber sie sind auf mehreren Ebenen geschützt, u. a. durch die inhärent komplexe Natur ihrer Modelle und den eigenwilligen Raum, den sie in der moralischen, ethischen und rechtlichen Landschaft einnehmen.

Was haben die Gerichte zu entscheiden? 

Während die Regulierungsbehörden noch über Regeln für KI nachdenken, könnten die Richter den ersten Versuch unternehmen, die künftige Urheberrechtslandschaft zu gestalten.

Dies könnte zu einem Flickenteppich von Rechtsvorschriften führen, der durch die Besonderheiten des jeweiligen Falles und des Gerichts, in dem er entschieden wurde, begrenzt ist.

Derzeit gibt es viele Fragen zu beantworten, darunter: 

F1: Ist für die Schulung eines Modells mit urheberrechtlich geschütztem Material eine Lizenz erforderlich?

  • Fairer Gebrauch vs. Lizenzierung: Die Gerichte müssen unter Umständen entscheiden, ob das vorübergehende Kopieren von Daten während der Ausbildung unter die "faire Nutzung" fällt, die die Verwendung ohne Lizenz erlauben würde. Dies könnte von Faktoren wie dem Zweck der Vervielfältigung, der Art des urheberrechtlich geschützten Werks, dem Umfang und der Wesentlichkeit des verwendeten Teils sowie den Auswirkungen auf den Marktwert des urheberrechtlich geschützten Werks abhängen.
  • Internationale Perspektiven: Die verschiedenen Rechtsordnungen können in dieser Frage unterschiedliche Standpunkte vertreten. Die EU-Urheberrechtsrichtlinie kann beispielsweise anders ausgelegt werden als das US-Urheberrechtsgesetz.

F2: Verstößt die generative KI-Ausgabe gegen das Urheberrecht für das Material, auf dem das Modell trainiert wurde?

  • Bestimmung von abgeleiteten Werken: Handelt es sich bei dem generativen Output lediglich um eine Umwandlung oder wird tatsächlich ein abgeleitetes Werk geschaffen, das gegen das Urheberrecht verstößt? Diese Frage könnte eine komplexe Analyse von Ähnlichkeit und Kreativität erfordern.
  • Haftungsfragen: Wer ist im Falle eines Verstoßes haftbar? Der Schöpfer der KI? Der Nutzer der KI? Der Vertreiber? 

F3: Verstößt generative KI gegen das Verbot, Informationen zur Verwaltung von Urheberrechten zu entfernen, zu verändern oder zu fälschen?

  • Besondere Fälle: Die Analyse spezifischer Algorithmen wie Stable Diffusion könnte notwendig sein, um festzustellen, ob die generierten Werke versehentlich Wasserzeichen oder andere urheberrechtliche Informationen reproduzieren oder manipulieren könnten.
  • Absichtliche vs. zufällige Verletzung: Die Gerichte müssen unter Umständen feststellen, ob die Entfernung oder Veränderung von urheberrechtlich geschützten Informationen beabsichtigt war oder ob es sich um eine unbeabsichtigte Folge des Betriebs der KI handelt.

F4: Verletzt die Erstellung von Arbeiten im Stil einer anderen Person deren Rechte?

  • Definition des Rechts auf Öffentlichkeitsarbeit: Das Recht auf Öffentlichkeit variiert von Gerichtsbarkeit zu Gerichtsbarkeit. Die Gerichte müssen unter Umständen auslegen, ob die Schaffung von Werken im Stil einer Person gleichbedeutend ist mit der Verwendung ihres Bildes oder ihrer Identität.
  • Kommerzielle vs. nicht-kommerzielle Nutzung: Die Anwendung kann unterschiedlich sein, je nachdem, ob die Ergebnisse der KI zu kommerziellen Zwecken verwendet werden oder nicht.

F5: Wie gelten Open-Source-Lizenzen für das Training von KI-Modellen und die Verbreitung der daraus resultierenden Ergebnisse?

  • Verständnis der Open-Source-Lizenzierung: Die Gerichte müssen möglicherweise festlegen, wie Open-Source-Lizenzen für KI-Trainingsdaten und generierte Ergebnisse gelten.

Im Moment fehlt uns nur eines: ein Urteil. Zum jetzigen Zeitpunkt wäre es töricht, vorherzusagen, ob grundloses Datenscraping weiterhin zulässig sein wird. Wenn die Erfinder eine Lücke im rechtlichen Schutzwall der KI-Industrie finden, könnte der Schaden beträchtlich sein. Aber das ist wohl eher ein großes Wenn.

Sobald die Urteile durchgesickert sind und wir dem Inkrafttreten der Vorschriften näher kommen, dürfte die künftige Richtung der KI klarer werden - Das heißt, bis zu den nächsten Herausforderungen.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen