YouTube-CEO warnt OpenAI vor möglicher Verletzung der Nutzungsbedingungen

5. April 2024

  • YouTube-CEO Neal Mohan erörtert mögliche Verstöße gegen die Nutzungsbedingungen von OpenAI
  • Wenn Sora auf YouTube-Videos trainiert worden wäre, wäre dies ein "klarer Verstoß".
  • Sora ist ein hochentwickeltes Text-zu-Video-Modell von OpenAI, das sich noch in der Testphase befindet.
OpenAI YouTube

Der CEO von YouTube, Neal Mohan, sagte, dass die mögliche Nutzung von YouTube-Videos durch OpenAI zum Trainieren des Text-zu-Video-Modells Sora gegen die Nutzungsbedingungen verstoßen würde. 

Mohan erklärte gegenüber Bloomberg: "Wenn Sora Inhalte von YouTube verwenden würde, wäre das ein 'klarer Verstoß' gegen die Nutzungsbedingungen."

YouTube und OpenAI werden sich nicht ausstehen können, denn beide stehen auf unterschiedlichen Seiten der Big-Tech-Kluft. 

Sora ist das revolutionäre neue Text-zu-Video-Modell von OpenAI, das sich noch in der Testphase befindet. Es steht für die Eroberung aller Medienformen durch die generative KI, angefangen mit Text, dann mit Bildern und jetzt mit Audio und Video. 

Generative Video- und Audiodaten bergen für KI-Unternehmen eine Reihe neuer Risiken, z. B. dass ihre Modelle nahezu exakte Kopien von urheberrechtlich geschütztem Material erstellen. 

Wir haben dies bereits mit dem Text-to-Audio-Modell Suno erlebt, das sehr ähnliche Audio zu berühmten Liedern wie "Bohemian Rhapsody" von Queen und "Dancing Queen" von ABBA. 

Weder OpenAI noch die meisten KI-Firmen sind besonders transparent in Bezug auf ihre Abhängigkeit von riesigen Datenmengen aus dem Internet, einschließlich urheberrechtlich geschütztem Material, um Modelle zu trainieren. 

OpenAI räumte sogar ein, dass es schwierig sei, urheberrechtlich geschützte Daten in seinen Entwicklungsprozessen zu vermeiden, und erklärte in einer Eingabe an die Britisches Oberhaus dass es "unmöglich" sei, die Technologie ohne sie zu bauen. 

Das war eine Art Freudscher Versprecher, der eine unbequeme Wahrheit über KI-Trainingsdaten ans Licht brachte.

Obwohl OpenAI behauptet, dass urheberrechtlich geschützte Daten für die generative KI unabdingbar sind, konnte bisher noch kein Verstoß vor Gericht nachgewiesen werden, was zeigt, dass das Urheberrecht in seiner jetzigen Form einfach nicht für dieses Zeitalter geschaffen wurde. 

Was das Training von Sora betrifft, so wusste OpenAI-CTO Mira Murati in einem Interview mit dem Wall Street Journal offenbar nicht, welche Inhalte für das Training von Sora verwendet wurden, einschließlich der Frage, ob es sich um YouTube-Inhalte handelte. 

Murati sagte: "Da bin ich mir nicht sicher", als er nach den Quellen für die Inhalte von Soras Training gefragt wurde, und fügte hinzu, dass alle verwendeten Daten entweder "öffentlich zugänglich oder lizenziert" seien.

Es ist kein glänzender Bericht über die Transparenz von OpenAI, während sie sich auf die Veröffentlichung ihres bahnbrechenden neuen Modells vorbereiten - eines, das sie bereits nutzen, um Ausschreibung für Geschäfte in Hollywood für seine möglichen Anwendungen in Film und Fernsehen. 

Sora hat Produzent Tyler Perry bereits veranlasst, eine Pause $800 Millionen für den Ausbau der Studiosund deutet damit an, dass ein massiver Umbruch in der Kreativwirtschaft bevorsteht. 

Der CEO von YouTube spricht über Sora

YouTube-CEO Mohan zeigte sein Bewusstsein für die laufenden Diskussionen über KI-Trainingspraktiken. Er deutete an, dass OpenAI die Verwendung von YouTube-Daten klären muss. 

Er sagte BloombergWenn ein Urheber seine harte Arbeit auf unsere Plattform hochlädt, hat er bestimmte Erwartungen. Eine dieser Erwartungen ist, dass die Nutzungsbedingungen eingehalten werden. Es ist nicht erlaubt, dass Dinge wie Transkripte oder Videoausschnitte heruntergeladen werden, und das ist ein klarer Verstoß gegen unsere Nutzungsbedingungen. Das sind die Spielregeln für die Inhalte auf unserer Plattform.

Die Nutzungsbedingungen von YouTube verbieten ausdrücklich das unerlaubte Scraping oder Herunterladen von YouTube-Inhalten", wie ein YouTube-Sprecher angesichts von Mohans Kommentaren bestätigte.

Alphabet, die Muttergesellschaft von YouTube, entwickelt eifrig ihre eigenen KI-Tools. Es ist zu erwarten, dass OpenAI direkt oder indirekt YouTube-Videos für das Training von Sora verwendet. 

Der Goldrausch der KI-Daten hat zu strategischen Partnerschaften und Lizenzvereinbarungen zwischen Technologieunternehmen und Inhaltsanbietern geführt. Zahlreiche Rechtsstreitigkeiten auf dem Gebiet der Text- und Bilderzeugung sind noch in Arbeit, aber sie sind noch nicht sehr aussagekräftig. 

Erstens: Selbst wenn KI-Modelle sich selbst entlarven, indem sie urheberrechtlich geschützte Werke reproduzieren (wie MidJourney Bilder ausspucken (z. B. aus Marvel-Filmen oder den Simpsons), ist es aufgrund ihres Blackbox-Charakters nahezu unmöglich festzustellen, wo diese Daten abgerufen wurden und wann genau der Verstoß stattfand. 

Zweitens: KI-generierte Audio-, Bild- und Videodateien können zwar ein deutlicher Beweis für eine Rechtsverletzung sein, aber es ist nicht so eindeutig, als würden Sie oder ich ein Bild von Mickey Mouse kopieren und es ohne Erlaubnis für Millionen verkaufen. 

Als Reaktion auf diesen rechtlichen Druck beginnen KI-Unternehmen, mit wertvollen Daten zu handeln. 

Zum Beispiel, Reddit ist $60 Millionen pro Jahr Die Lizenzvereinbarung mit Google über die Schulung von KI-Tools ist ein Beispiel für die formellen Vereinbarungen, die in der Branche entstehen. 

In ähnlicher Weise haben Medienorganisationen wie The Associated Press und Axel Springer haben Vereinbarungen getroffen die Nutzung ihrer Inhalte für das KI-Training zu gestatten, wobei in den von der KI generierten Antworten eine Namensnennung vorgesehen ist.

Das bringt seine eigenen Herausforderungen mit sich. Generative KI ist kostspielig in der Entwicklung und im Betrieb, und jetzt müssen KI-Unternehmen für die Daten bezahlen, anstatt sie einfach aus dem Internet zu ziehen. 

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen