Die Autoren Mona Awad und Paul Tremblay haben eine Klage gegen OpenAI, den Erfinder von ChatGPT, eingereicht.
Mona Awad, Autorin von "13 Ways of Looking at a Fat Girl", und Paul Tremblay, Autor von "The Cabin at the End of the World", behaupten, dass die KI-Plattform ihre Urheberrechte verletzt hat, indem sie ihr Modell ohne ihre Zustimmung mit ihren Werken trainierte.
ChatGPT wird auf öffentlich zugänglichen Daten aus dem Internet trainiert. Awad und Tremblay zufolge wurden ihre urheberrechtlich geschützten Romane jedoch illegal zum Trainieren von ChatGPT verwendet. Dieser Verdacht wurde geäußert, weil der Chatbot "sehr genaue Zusammenfassungen" ihrer Bücher erstellen kann, wie es in den Klageunterlagen heißt.
Die Autoren argumentieren, dass die KI, als sie ChatGPT baten, Zusammenfassungen ihrer Romane zu liefern, Informationen zurückgab, die nicht natürlich öffentlich verfügbar. ChatGPT könnte zwar von Zusammenfassungen lernen, die auf Websites wie Wikipedia veröffentlicht werden, doch diese bieten nicht genügend Details, um die Tiefe der KI-Zusammenfassung zu rechtfertigen. Die Klägerinnen Exponate bereitstellen um dies zu demonstrieren.
Dies ist die erste Klage dieser Art gegen OpenAI in Bezug auf Urheberrechtsfragen, sagt Andres Guadamuz, Dozent für Recht des geistigen Eigentums an der Universität von Sussex.
Damit ist dies der nächste Eintrag in einer langen Reihe von Klagen gegen OpenAI, auch wenn die meisten davon Verleumdungsklagen.
Darüber hinaus hat es mehrere Urheberrechtsfälle im Bereich der Bilderzeugung gegeben, darunter Getty Images, das eine Klage Klage gegen Stability AI für die unentgeltliche Verwendung ihrer Bilder.
AI-Nutzung von "Schattenbibliotheken"
Saveri und Butterick behaupten, dass OpenAI hinsichtlich seiner Trainingsdaten "zunehmend geheimnisvoll" geworden ist, was wahrscheinlich ein fairer Kommentar ist. In den frühen Entwicklungsphasen von ChatGPT gab OpenAI bekannt, dass es ein großes "internetbasiertes Buchkorpus" zum Training verwendet, das den Namen "Books2" trägt.
Angesichts der geschätzten 294.000 Titel in dem Datensatz vermuten die Anwälte, dass OpenAI die Bücher aus "Schattenbibliotheken" wie Library Genesis (LibGen) und Z-Library bezogen hat. Sogenannte Schattenbibliotheken sind digitale Repositorien für Bücher und wissenschaftliche Arbeiten.
Obwohl sie in erster Linie für den akademischen Gebrauch bestimmt sind, enthalten die meisten illegal kopierte Bücher.
Es gibt kaum einen Konsens über die verschiedenen rechtlichen Aspekte von Schattenbibliotheken - sie sind zu einem Teil des Internet-Mobiliars geworden.
Die Beschwerde sagtDiese offenkundig illegalen Schattenbibliotheken sind für die KI-Trainingsgemeinschaft schon lange von Interesse.
In einem Bericht des GuardianLilian Edwards, Professorin für Recht, Innovation und Gesellschaft an der Universität Newcastle, vermutet, dass dieser spezielle Fall davon abhängen könnte, ob Gerichte die Verwendung von urheberrechtlich geschütztem Material für das KI-Training als "faire Nutzung" betrachten. Die Definitionen von "fair use" variieren international, was das Problem weiter verkompliziert.
Die Erfolgsaussichten? Wahrscheinlich gering, aber der rechtliche Druck auf KI-Unternehmen aller Art wächst.
Künftige KI-Verordnungen, wie die EU-KI-Gesetzsollen Transparenzrichtlinien durchgesetzt werden, die die Entwickler verpflichten, ihre Trainingsdaten zu veröffentlichen.