Reddit ligt momenteel onder de lens van de Federal Trade Commission (FTC) voor zijn AI-licentiepraktijken voor gegevens, die werden onthuld in de aanloop naar een geplande beursgang.
Het onderzoek van de FTC richt zich op de "verkoop, licenties of het delen van door gebruikers gegenereerde inhoud met derden om AI-modellen te trainen" van Reddit.
Het komt op het moment dat Reddit zich voorbereidt om naar de beurs te gaan, met plannen om de prijs van de aandelen tussen $31 en $34 te zetten, waardoor het bedrijf mogelijk gewaardeerd wordt op ongeveer $6,5 miljard.
Reddit zit op een van de grootste goudmijnen in de geschiedenis van internetcontent. De intentie om berichten en commentaren te verkopen heeft een uitbarstend debat veroorzaakt onder de 850 miljoen gemiddelde maandelijkse gebruikers.
Een Reddit-post is getiteld "Sinds Reddit officieel gebruikersgegevens verkoopt, zijn jouw verhalen dan veilig?" met respondenten die afspreken om "de komende zestig dagen elke dag nutteloze afvalgegevens te dumpen op Reddit".
Dat is een interessant punt - de gegevens van Reddit zijn zeer gevoelig voor de input van gebruikers en met zulke sterke gemeenschappen op zijn plaats zou het bedrijf niet te zelfgenoegzaam moeten zijn over zijn recht op door gebruikers gegenereerde inhoud.
Niettemin, Reddit stelt dat het verkopen van gegevens blijft in harmonie met haar principes en stelt: "De kans is niet in strijd met onze waarden en de rechten van onze Redditors."
De financiële vooruitzichten van Reddit lijken robuust, met een omzetstijging van 20% vorig jaar, tot $804 miljoen, grotendeels gedreven door advertenties.
Tot nu toe heeft Reddit onder meer gegevenslicentieovereenkomsten gesloten met een waarde van $203 miljoen. Reddit verwacht in 2024 minstens $66,4 miljoen te genereren uit deze overeenkomsten. Het is een bescheiden deel van de totale inkomstenstroom, maar kan exponentieel groeien.
Reddit is al een samenwerking aangegaan met Google om onder andere AI-modellen te trainen. Dit benadrukt het belang van zijn gegevens in een wereld waarin techbedrijven steeds meer bereid zijn om te betalen voor hun gegevens in plaats van dubieuze bronnen voor 'openbaar gebruik' te schrapen.
In reactie op de opmerkingen van de FTC zegt Reddit verklaardeWe zijn niet verbaasd dat de FTC interesse heeft getoond in de praktijken van de FTC met betrekking tot het licentiëren van gegevens en schrijven het onderzoek toe aan "de nieuwe aard van deze technologieën en commerciële afspraken".
Bovendien beweert Reddit dat het gelooft in de wettelijkheid van zijn praktijken en benadrukt: "We geloven niet dat we ons schuldig hebben gemaakt aan oneerlijke of misleidende handelspraktijken".
Het bedrijf deelde ook inzichten in de lopende dialoog met de FTC: "De brief gaf aan dat de medewerkers van de FTC geïnteresseerd waren in een ontmoeting met ons om meer te weten te komen over onze plannen en dat de FTC van plan was om informatie en documenten bij ons op te vragen naarmate het onderzoek vorderde."
De FTC heeft zich de laatste tijd harder opgesteld tegenover technologiedeals. nieuwe onderzoeksbevoegdheden over AI-bedrijven afgelopen november.
De nieuwe goudmijn van betaalde gegevens
Gegevens zijn goedkoop voor generatieve AI-bedrijven, met databases die zijn gemaakt door webentiteiten zoals Common Crawl en LAION die de steunpilaar van trainingsgegevens vormen.
Dat is echter aan het veranderen, nu rechtszaken over auteursrechten zich opstapelen en de EU AI-wet pogingen om strengere gegevenspraktijken voor de industrie op te leggen.
Bovendien zijn veel websites actief blokkeren AI-webcrawlers. Het tijdperk van het Wilde Westen van gratis trainingsgegevens loopt misschien ten einde.
Reddit is niet het enige bedrijf dat de waarde van zijn content kent. Automattic, het moederbedrijf van WordPress en Tumblr, is naar verluidt in gesprek met MidJourney en OpenAI voor een content- en datadeal.
Terwijl Reddit zich voorbereidt op zijn beursgang, zal het traject van het bedrijf nauwlettend in de gaten worden gehouden door zowel toezichthouders als Redditors.