Automattic, das Unternehmen hinter WordPress und Tumblr, verhandelt mit MidJourney und OpenAI über ein Daten- und Inhaltsabkommen.
Diese Informationen, die ursprünglich unter 404 Medien und basierend auf Berichten einer ungenannten Quelle innerhalb von Automattic, deutet darauf hin, dass eine Vereinbarung mit OpenAI und MidJourney unmittelbar bevorstehen könnte.
Dies folgt auf Gerüchte, die auf Tumblr über einen möglichen Deal mit MidJourney kursieren, der eine neue Einnahmequelle für die Plattform darstellen könnte.
404 sagt, dass der Deal-Prozess bisher chaotisch war, einschließlich eines teilweise fehlgeschlagenen Datentransfers zu OpenAI und MidJourney, der, in den Worten eines Tumblr-Produktmanagers ausgedrückt, einen Inhalt hatte:
"Private Beiträge in öffentlichen Blogs, Beiträge in gelöschten oder gesperrten Blogs, unbeantwortete Fragen (diese sind normalerweise nicht öffentlich, bis sie beantwortet werden), private Antworten (diese werden nur dem Empfänger angezeigt und sind nicht öffentlich), Beiträge, die nach unseren modernen Standards als 'explizit' / NSFW / 'reif' gekennzeichnet sind (das ist vielleicht keine große Sache, ich weiß es nicht)".
Die Auswirkungen sind noch unklar, und weitere Einzelheiten der Vereinbarung werden noch bekannt gegeben.
Der Goldrausch für KI-Trainingsdaten geht in die nächste Runde
Und schon hat der Goldrausch für KI-Trainingsdaten einen neuen Gang eingelegt.
Ja, generative KI-Unternehmen haben schon immer riesige Datenmengen benötigt - aber jetzt wollen sie lieber dafür bezahlen, als sie kostenlos zu sammeln.
Vor wenigen Tagen, Reddit diskutierte Berichten zufolge seine umfangreichen nutzergenerierten Inhalte an ein noch zu benennendes KI-Unternehmen zu lizenzieren, ein Geschäft, das jährlich etwa $60 Millionen wert sein könnte. Dies geschieht zu einem Zeitpunkt, an dem Reddit sich auf einen Börsengang im März vorbereitet und eine Bewertung von fast $5 Milliarden anstrebt.
Diese potenzielle Lizenzvereinbarung entspricht einem wachsenden Trend unter Technologieunternehmen, sich rechtmäßige Datennutzungsvereinbarungen zu sichern, insbesondere angesichts der zunehmenden urheberrechtlichen Risiken.
Laufende Rechtsstreitigkeiten, wie zum Beispiel die Klage bei der New York Timeshaben die Dringlichkeit von Inhalten erhöht Geschäfte.
Der Schritt von Automattic, mit KI-Unternehmen zu verhandeln, wirft Fragen über die Verwendung von nutzergenerierten Inhalten für das KI-Training auf.
Das Unternehmen hat angeblich angekündigt, eine neue Funktion einzuführen, die es den Nutzern ermöglicht, die Weitergabe ihrer Daten an Dritte, einschließlich KI-Unternehmen, abzulehnen.
Automattic machte eine öffentliche Stellungnahme veröffentlicht, in dem es heißt: "Wir blockieren derzeit standardmäßig die Crawler der wichtigsten KI-Plattformen - einschließlich derer der größten Tech-Unternehmen - und aktualisieren unsere Listen, sobald neue hinzukommen" und "teilen nur öffentliche Inhalte, die auf WordPress.com und Tumblr gehostet werden, von Websites, die sich nicht abgemeldet haben".
Weiter heißt es: "Wir arbeiten auch direkt mit ausgewählten KI-Unternehmen zusammen, solange ihre Pläne mit dem übereinstimmen, was unserer Community wichtig ist: Attribution, Opt-outs und Kontrolle."
Wenn Sie sich jedoch dagegen entscheiden, dass Ihre Daten für das KI-Training verwendet werden, könnten die Konten der Nutzer bestraft werden.
In einer neuen, noch nicht veröffentlichten FAQ mit dem Titel "Was passiert, wenn Sie sich abmelden?" heißt es: "Wenn Sie sich von Anfang an abmelden, werden wir den Crawlern den Zugriff auf Ihre Inhalte verwehren, indem wir Ihre Website auf eine Liste mit nicht zugelassenen Inhalten setzen. Wenn Sie Ihre Meinung später ändern, planen wir außerdem, alle Partner zu aktualisieren, die sich neu abgemeldet haben, und bitten darum, dass ihre Inhalte aus vergangenen Quellen und zukünftigen Schulungen entfernt werden."
Wir leben heute in einer Welt, in der alles, was Sie im Internet veröffentlicht haben, für KI-Trainingszwecke verkauft werden könnte - wenn es nicht kostenlos ist.
Und mit der Weiterentwicklung der KI wird sich die Debatte über die Datennutzung und den Datenschutz wahrscheinlich verschärfen.
Unternehmen, die im Besitz von Datengoldminen sind, können viel gewinnen, aber zu welchem Preis für den durchschnittlichen Internetnutzer?