OpenAI und The Associated Press (AP) kündigen Zusammenarbeit beim KI-Training an

Juli 15, 2023

AP OpenAI

OpenAI hat eine Lizenzvereinbarung mit The Associated Press (AP) bestätigt, um seine KI-Modelle anhand des Nachrichtenarchivs zu trainieren.

Der Kern der Vereinbarung besagt, dass AP OpenAI Zugang zu seinem Fundus an Textgeschichten für das KI-Training gewährt. Im Gegenzug wird OpenAI seine Technologie auf AP ausweiten, damit diese generative KI in ihre Arbeitsabläufe integrieren können. 

OpenAI wird das Recht haben, Daten aus dem AP-Story-Archiv zu scrapen, das bis ins Jahr 1985 zurückreicht.

"Generative KI ist ein sich schnell entwickelnder Bereich mit enormen Auswirkungen auf die Nachrichtenbranche. Wir freuen uns, dass OpenAI anerkennt, dass faktenbasierte, unparteiische Nachrichteninhalte für diese sich entwickelnde Technologie unerlässlich sind, und dass sie den Wert unseres geistigen Eigentums respektieren. sagte Kristin Heitmann, AP Senior Vice President und Chief Revenue Officer.

Die Nutzung öffentlicher Internetdaten zum Training von KI-Systemen wird immer mehr zu einem Streitpunkt. Dies wird wahrscheinlich die Popularität dieser Art von privaten und gesponserten Geschäften erhöhen.

Die großen Sprachmodelle (LLMs), die Chatbots bei OpenAI, Google usw. antreiben, wurden auf einer riesigen Menge von Daten trainiert, die aus öffentlich zugänglichen Internetquellen stammen. 

Dazu gehören Inhalte Dritter wie Nachrichtenartikel, Wikipedia-Einträge und Kommentare aus sozialen Medien und Blogs, die ohne ausdrückliche Genehmigung oder Wissen der Autoren übernommen wurden.

Dies ist nicht ohne rechtliche und ethische Probleme, denn es ist unwahrscheinlich, dass alle diese Daten legal erhoben werden. Zumindest verzerren die KI-Trainingsdaten die Bedeutung von "offen" und "öffentlich zugänglich". 

Andres Sawicki, Professor für Recht des geistigen Eigentums an der Universität von Miami, kommentierte: "Die Datensätze enthalten eine Menge urheberrechtlich geschützter Inhalte. Die Urheberrechtsinhaber sind mit dieser Verwertung nicht einverstanden. Es ist nicht schwer vorstellbar, dass es noch mehr Vereinbarungen wie die von AP zwischen Technologieunternehmen und Inhaltsproduzenten geben wird, um eine "saubere Datenbank" aufzubauen. Das Problem ist, dass die Datensätze, die zum Trainieren der Modelle benötigt werden, so umfangreich sind, dass ich bezweifle, dass es möglich sein wird, die Zustimmung einer ausreichenden Zahl von Rechteinhabern zu erhalten, um die Technologie praktikabel zu machen."

Diese Woche hat die US Federal Trade Commission (FTC) eingeleitete Untersuchungen die Praktiken von OpenAI im Zusammenhang mit der Verwendung von Daten bei der Modellschulung zu untersuchen. Die FTC hat von OpenAI Unterlagen verlangt, um die Strategien des Unternehmens zu verstehen und Verstöße zu erkennen. 

OpenAI und AP haben sich positiv über die Partnerschaft geäußert und erklärt, dass sie "an die verantwortungsvolle Entwicklung und Nutzung dieser KI-Systeme glauben". 

 

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen