OpenAI hat öffentlich auf die Klage wegen Urheberrechtsverletzung reagiert, die die New York Times im Dezember angestrengt hat.
Die Erklärung wird wahrscheinlich nicht zu einer Rücknahme der die Klage aber sie gibt einen Einblick in die Argumentationslinien, die die Anwälte des Unternehmens verfolgen könnten.
Hier ist eine TLDR-Version der vier wichtigsten Punkte der Erklärung:
1. OpenAI sagt, es wolle "ein gesundes Nachrichten-Ökosystem unterstützen, ein guter Partner sein und für beide Seiten vorteilhafte Möglichkeiten schaffen". Es sagt, seine Produkte könnten Reportern und Redakteuren helfen, ihre Arbeit besser zu machen und ihr Zielpublikum auf neue Weise zu erreichen.
Im Gegenzug möchte es deren Daten nutzen, um seine Modelle zu trainieren. OpenAI nannte mehrere Medienunternehmen wie Axel Springer, mit denen es eine für beide Seiten vorteilhafte Beziehung eingegangen ist.
2. OpenAI ist nach wie vor der Meinung, dass das Training von KI-Modellen mit öffentlich zugänglichen Daten faire Nutzung und listet Länder und Organisationen auf, die dem zustimmen.
OpenAI bietet nun eine Möglichkeit, Scraper-Bots zu blockieren, aber es wird keine Option erwähnt, historische Trainingsdaten vor der Opt-out-Funktion zu entfernen.
3. Die wörtliche Wiedergabe von urheberrechtlich geschützten Inhalten ist ein "seltener Fehler" und OpenAI arbeitet daran, diesen zu beheben. Wenn Inhalte von The Times syndiziert und auf mehreren Plattformen veröffentlicht werden, ist es unvermeidlich, dass sie von ChatGPT reproduziert werden, wenn die Nutzer wirklich versuchen, sie dazu zu bringen.
OpenAI sagt, dass sie von den Nutzern erwarten, dass sie "verantwortungsvoll handeln" und dies nicht tun. Der Inhalt der "New York Times" ist nur ein winziger Teil der Trainingsdaten von ChatGPT, so dass OpenAI sagt, dass es nicht wirklich viel bringt, was die Trainingsdaten angeht.
4. OpenAI sagt, die New York Times erzähle nicht die ganze Geschichte. OpenAI dachte, dass ihre Gespräche positiv verlaufen würden, bis sie eine Ausgabe der Times in die Hand nahmen und von der Klage erfuhren.
Die Beispiele für den wiedergekäuten Inhalt stammten aus alten Artikeln, die überall im Internet zu finden waren. OpenAI sagt, dass die Beispiele für den wörtlichen Inhalt herbeigeführt wurden und vermutet, dass "sie entweder das Modell angewiesen haben, den Inhalt wiederzukauen, oder ihre Beispiele aus vielen Versuchen ausgewählt haben".
Die Erklärung, die Sie hier vollständig lesenendet damit, dass OpenAI die Hoffnung äußert, die Dinge mit Papier zu regeln. Die Alternative sieht für beide Seiten nicht gut aus.