Automattic, l'azienda dietro WordPress e Tumblr, sta discutendo un accordo su dati e contenuti con MidJourney e OpenAI.
Queste informazioni, inizialmente coperte da 404 Media e in base a quanto riferito da una fonte senza nome all'interno di Automattic, indica che un accordo con OpenAI e MidJourney potrebbe essere imminente.
Questo segue le voci che circolano su Tumblr riguardo a un potenziale accordo con MidJourney che potrebbe introdurre un nuovo flusso di entrate per la piattaforma.
404 afferma che il processo di negoziazione è stato finora disordinato, compreso un trasferimento di dati parzialmente fallito a OpenAI e MidJourney che conteneva, secondo le parole di uno dei product manager di Tumblr:
"Post privati su blog pubblici, post su blog cancellati o sospesi, domande senza risposta (normalmente non sono pubbliche finché non vengono esaudite), risposte private (queste vengono visualizzate solo dal destinatario e non sono pubbliche), post che sono contrassegnati come 'espliciti' / NSFW / 'maturi' secondo i nostri standard più moderni (questo potrebbe non essere un grosso problema, non lo so)".
Le implicazioni di questo fatto non sono ancora chiare e si attendono ulteriori dettagli sull'accordo.
La corsa all'oro per i dati di addestramento dell'intelligenza artificiale sale di livello
E così, la corsa all'oro per i dati di addestramento dell'IA è salita di livello.
È vero che le aziende di IA generativa hanno sempre avuto bisogno di grandi quantità di dati, ma ora si stanno affrettando a pagarli piuttosto che a scovarli gratuitamente.
Solo pochi giorni fa, Reddit avrebbe discusso concedendo in licenza la sua vasta gamma di contenuti generati dagli utenti a una società di intelligenza artificiale non ancora rivelata, un accordo che potrebbe valere circa $60 milioni all'anno. Questo emerge mentre Reddit si prepara a un'offerta pubblica di vendita a marzo, con l'obiettivo di ottenere una valutazione vicina a $5 miliardi.
Questo potenziale accordo di licenza si allinea con la crescente tendenza delle aziende tecnologiche ad assicurarsi accordi legittimi per l'utilizzo dei dati, soprattutto a fronte dei crescenti rischi legati al copyright.
Le battaglie legali in corso, come la Causa del New York Timeshanno aumentato l'urgenza dei contenuti offerte.
La mossa di Automattic di negoziare con le aziende di IA solleva dubbi sull'uso di contenuti generati dagli utenti per l'addestramento dell'IA.
L'azienda avrebbe annunciato l'intenzione di introdurre una nuova funzione che consenta agli utenti di scegliere di non condividere i propri dati con terze parti, comprese le aziende di intelligenza artificiale.
Automattic fatto un dichiarazione pubblica pubblicato in seguito al rapporto 404, in cui si legge: "Attualmente blocchiamo, per impostazione predefinita, i principali crawler di piattaforme AI - compresi quelli delle più grandi aziende tecnologiche - e aggiorniamo i nostri elenchi non appena ne vengono lanciati di nuovi", e "condivideremo solo i contenuti pubblici ospitati su WordPress.com e Tumblr dai siti che non hanno optato per l'esclusione".
E continua: "Stiamo anche lavorando direttamente con aziende di AI selezionate, purché i loro piani siano in linea con ciò che sta a cuore alla nostra comunità: attribuzione, opt-out e controllo".
Tuttavia, la rinuncia all'utilizzo dei propri dati per l'addestramento dell'intelligenza artificiale potrebbe penalizzare gli account degli utenti.
Una nuova FAQ, non ancora pubblicata, intitolata "Cosa succede quando si rinuncia?" afferma: "Se si rinuncia fin dall'inizio, bloccheremo i crawler dall'accesso ai contenuti aggiungendo il sito a un elenco di non ammessi. Se in seguito cambiate idea, abbiamo intenzione di aggiornare tutti i partner sulle persone che hanno deciso di rinunciare e di chiedere che i loro contenuti vengano rimossi dalle fonti precedenti e dalle formazioni future".
Oggi viviamo in un mondo in cui tutto ciò che avete postato su Internet potrebbe essere venduto per scopi di addestramento dell'intelligenza artificiale, se non viene preso gratuitamente.
Con l'evoluzione dell'IA, il dibattito sull'uso dei dati e sulla privacy probabilmente si intensificherà.
Le aziende che possiedono miniere d'oro di dati possono vincere alla grande, ma a quale costo per l'utente medio di Internet?