Reddit è attualmente sotto la lente della Federal Trade Commission (FTC) per le sue pratiche di licenza di dati sull'intelligenza artificiale, rivelate prima di una prevista IPO.
L'indagine della FTC si concentra sulla "vendita, la concessione in licenza o la condivisione di contenuti generati dagli utenti con terze parti per addestrare modelli di intelligenza artificiale".
La notizia arriva mentre Reddit si sta preparando a quotarsi in borsa, con l'intenzione di fissare il prezzo delle sue azioni tra $31 e $34, valutando potenzialmente l'azienda a circa $6,5 miliardi.
Reddit è seduto su una delle più grandi miniere d'oro nella storia dei contenuti internet. La sua intenzione di vendere i post e i commenti ha provocato un dibattito esplosivo tra i suoi 850 milioni di utenti medi mensili.
Un post su Reddit è intitolato "Dal momento che Reddit sta vendendo ufficialmente i dati degli utenti, le vostre storie sono al sicuro?" e chi risponde accetta di "iniziare a scaricare dati inutili e spazzatura su Reddit ogni giorno per i prossimi sessanta giorni".
Si tratta di un punto interessante: i dati di Reddit sono molto sensibili agli input degli utenti e, con una comunità così forte, l'azienda non dovrebbe essere troppo compiaciuta del suo diritto ai contenuti generati dagli utenti.
Tuttavia, Reddit sostiene che la vendita di dati rimane in armonia con i suoi principi, dichiarando: "L'opportunità non è in conflitto con i nostri valori e con i diritti dei nostri Redditor".
Le prospettive finanziarie di Reddit appaiono solide, con un aumento delle entrate di 20% lo scorso anno, pari a $804 milioni di euro, in gran parte trainati dalla pubblicità.
Finora, Reddit ha stipulato accordi di licenza di dati per un valore di $203 milioni. Prevede di generare almeno $66,4 milioni da questi accordi nel 2024. Si tratta di una parte modesta del flusso di entrate totali, ma potrebbe crescere in modo esponenziale.
Reddit ha già avviato una collaborazione con Google finalizzata, tra gli altri obiettivi, all'addestramento di modelli di intelligenza artificiale. Ciò evidenzia l'importanza dei suoi dati in un mondo in cui le aziende tecnologiche sono sempre più disposte a pagare per i loro dati piuttosto che limitarsi a raschiare fonti di dubbio "uso pubblico".
Riflettendo sui commenti della FTC, Reddit dichiaratoNon siamo sorpresi che la FTC abbia espresso interesse" per le sue pratiche di licenza dei dati, attribuendo l'esame alla "natura innovativa di queste tecnologie e degli accordi commerciali".
Inoltre, Reddit afferma di credere nella legalità delle sue pratiche, sottolineando: "Non crediamo di aver messo in atto alcuna pratica commerciale sleale o ingannevole".
L'azienda ha inoltre fornito informazioni sul dialogo in corso con l'FTC: "La lettera indicava che lo staff dell'FTC era interessato a incontrarci per saperne di più sui nostri piani e che l'FTC intendeva richiederci informazioni e documenti man mano che la sua indagine proseguiva".
Negli ultimi tempi la FTC ha adottato una linea più dura nei confronti degli accordi tecnologici, con l'autorizzazione dell'agenzia di nuovi poteri investigativi sulle aziende di AI lo scorso novembre.
La nuova corsa ai dati a pagamento
I dati sono arrivati a buon mercato per le aziende di IA generativa, con i database creati da entità web come Common Crawl e LAION che costituiscono la base dei dati di addestramento.
Tuttavia, la situazione sta cambiando, con l'accumularsi di cause legali per il diritto d'autore e il Legge UE sull'AI che tentano di imporre al settore pratiche più rigorose in materia di dati.
Inoltre, molti siti web sono bloccando attivamente Web crawler AI. L'era del Far West dei dati di addestramento gratuiti potrebbe finire.
Reddit non è l'unica azienda che conosce il valore dei propri contenuti. Automattic, la società madre di WordPress e Tumblr, sta secondo quanto riferito, in trattative con MidJourney e OpenAI per un accordo su contenuti e dati.
Mentre Reddit si prepara alla sua IPO, la traiettoria dell'azienda sarà osservata da vicino sia dalle autorità di regolamentazione che dai redditori.