OpenAI hat auf zwei nahezu identische Sammelklagen reagiert, die von einer Reihe von Autoren gegen das Unternehmen eingereicht wurden, und argumentiert, dass die meisten der Vorwürfe abgewiesen werden sollten.
Die Autoren behaupten, dass ihre Urheberrechte verletzt wurden, als das Unternehmen ihre Arbeit als Trainingsdaten für ChatGPT verwendete. Die Vorwürfe in der Klage lauten:
- direkte Urheberrechtsverletzung
- stellvertretende Urheberrechtsverletzung
- Entfernung von Informationen zur Verwaltung des Urheberrechts (DMCA)
- unlauterer Wettbewerb
- ungerechtfertigte Bereicherung
- Fahrlässigkeit
OpenAI freut sich, dass der erste Vorwurf vor Gericht verhandelt wird, aber die übrigen fünf Vorwürfe sind rechtlich falsch und sollten zurückgewiesen werden.
Die Kläger behaupten, dass alles, was ChatGPT ausgibt, eine Ableitung ihres urheberrechtlich geschützten Werks ist, da ihre Bücher für die Ausbildung von ChatGPT verwendet wurden.
OpenAI will weder bestätigen noch dementieren, dass die fraglichen Bücher Teil des Trainingsdatensatzes waren. Aber selbst wenn die Bücher im Datensatz enthalten waren, war dies nur ein winziger Teil einer riesigen Datenmenge.
OpenAI argumentierte, dass dies unter den Grundsatz der fairen Nutzung falle, die nicht gegen das Urheberrecht verstoße.
Die Autoren könnten es schwer haben, das Gericht von ihrem Argument zu überzeugen. Sie argumentieren nicht, dass ChatGPT ähnliche Bücher wie sie schreibt und mit ihnen konkurriert. Sie behaupten, dass jedes Wort, das ChatGPT veröffentlicht, eine Verletzung des Urheberrechts darstellt.
In seinem Antrag auf Klageabweisung sagte OpenAI: "Laut den Beschwerden ist jede einzelne ChatGPT-Ausgabe - von einer einfachen Antwort auf eine Frage (z.B. "Ja") über den Namen des Präsidenten der Vereinigten Staaten bis hin zu einem Absatz, der die Handlung, die Themen und die Bedeutung von Homers Ilias beschreibt - notwendigerweise ein verletzendes "abgeleitetes Werk" der Bücher der Kläger."
Das wird schwer zu bestreiten sein. Sogar die genauen Zusammenfassungen, die ChatGPT über die fraglichen Bücher erstellt, werden in dem Antrag als "Buchberichte oder Rezensionen" beschrieben und nicht als Versuch, von urheberrechtlich geschützten Werken zu profitieren.
Die Einzelheiten zu den übrigen Argumenten finden Sie in OpenAIs Antrag auf Ablehnung.
Warum beantragt OpenAI nicht die Abweisung des gesamten Verfahrens?
In dem Antrag von OpenAI heißt es, dass sie nicht die Abweisung der Klage wegen direkter Urheberrechtsverletzung beantragt, "die OpenAI in einem späteren Stadium des Falles rechtlich zu klären versuchen wird".
OpenAI und Meta haben nicht genau offengelegt, welche Daten sie zum Trainieren ihrer Modelle verwendet haben, aber es war mit ziemlicher Sicherheit eine Menge urheberrechtlich geschütztes Material dabei, einschließlich der Bücher der Autoren, die die Klagen eingereicht haben.
Wenn urheberrechtlich geschützte Daten enthalten waren, dann war sich OpenAI dessen sicherlich bewusst. Das Unternehmen wird argumentieren, dass die Absicht hinter dem Zugriff auf das Material nicht darin bestand, abgeleitete Werke zu erstellen und davon in Konkurrenz zu den Originalen zu profitieren.
Wenn das Gericht zustimmt, wird die Entscheidung einen Präzedenzfall schaffen, auf den man sich in einer Reihe anderer laufender KI-Prozesse stützen wird.
Eine Entscheidung zu seinen Gunsten würde bedeuten, dass das Unternehmen nicht für die Verwendung urheberrechtlich geschützter Daten in der Vergangenheit verklagt werden kann und dass es dies weiterhin tun kann, um seine neuen Modelle zu trainieren. Und wenn das Gericht entscheidet, dass KI-Training unter den Grundsatz der fairen Nutzung fällt, dann ist auch für andere KI-Unternehmen die Saison eröffnet.
Es ist ein riskanter Schritt, aber irgendwann muss diese Frage geklärt werden. Wenn die Entscheidung gegen OpenAI ausfällt, muss es ChatGPT verwerfen und das Training von Grund auf neu beginnen. Diesmal mit einem viel kleineren Datensatz.