Automattic, företaget bakom WordPress och Tumblr, diskuterar ett data- och innehållsavtal med MidJourney och OpenAI.
Denna information, som ursprungligen täcktes av 404 Medier och baserat på rapporter från en icke namngiven källa inom Automattic, indikerar att ett avtal med OpenAI och MidJourney kan vara nära förestående.
Detta följer på rykten som cirkulerar på Tumblr om ett potentiellt avtal med MidJourney som skulle kunna introducera en ny intäktsström för plattformen.
404 säger att affärsprocessen har varit rörig hittills, inklusive en delvis misslyckad dataöverföring till OpenAI och MidJourney som innehöll, med en av Tumblrs produktchefers ord:
"Privata inlägg på offentliga bloggar, inlägg på raderade eller avstängda bloggar, obesvarade frågor (normalt är dessa inte offentliga förrän de besvaras), privata svar (dessa visas endast för mottagaren och är inte offentliga), inlägg som är markerade som "explicita" / NSFW / "mogna" enligt våra mer moderna standarder (detta kanske inte är en stor sak, jag vet inte)."
Konsekvenserna av detta är fortfarande oklara och ytterligare detaljer om affären är på väg.
Guldruschen för AI-träningsdata går upp ett snäpp
Och vips har guldruschen för AI-träningsdata lagt i en högre växel.
Ja, generativa AI-företag har alltid behövt stora mängder data - men de skyndar sig nu att betala för den i stället för att skrapa den gratis.
För bara några dagar sedan, Reddit ska enligt uppgift ha diskuterat Reddit licensierar sitt stora utbud av användargenererat innehåll till ett ännu inte avslöjat AI-företag, en affär som kan vara värd cirka $60 miljoner årligen. Detta framkommer när Reddit förbereder sig för ett offentligt erbjudande i mars, med sikte på en värdering nära $5 miljarder.
Detta potentiella licensavtal ligger i linje med en växande trend bland teknikföretag att säkra legitima avtal om dataanvändning, särskilt mot bakgrund av ökande upphovsrättsliga risker.
Pågående rättsliga tvister, såsom New York Times stämningsansökanhar ökat behovet av innehåll erbjudanden.
Automattics drag att förhandla med AI-företag väcker frågor om att använda användargenererat innehåll för AI-träning.
De har enligt uppgift meddelat att de planerar att införa en ny funktion som gör det möjligt för användare att välja bort att deras data delas med tredje part, inklusive AI-företag.
Automattic gjorde en offentligt uttalande publicerades efter 404:s rapport, där det stod: "Vi blockerar för närvarande, som standard, stora AI-plattforms crawlers - inklusive de från de största teknikföretagen - och uppdaterar våra listor när nya lanseras" och "kommer endast att dela offentligt innehåll som finns på WordPress.com och Tumblr från webbplatser som inte har valt bort det."
"Vi arbetar också direkt med utvalda AI-företag så länge som deras planer överensstämmer med vad vårt samhälle bryr sig om: tillskrivning, opt-outs och kontroll."
Om du väljer att inte låta din information användas för AI-träning kan det dock leda till att användarnas konton straffas.
I en ny FAQ med rubriken "Vad händer när du väljer att inte delta?" står det: "Om du väljer att inte delta från början kommer vi att blockera sökrobotar från att komma åt ditt innehåll genom att lägga till din webbplats på en lista över otillåtna webbplatser. Om du ändrar dig senare planerar vi också att uppdatera alla partners om personer som nyligen har valt att inte delta och ber att deras innehåll ska tas bort från tidigare källor och framtida utbildning."
Vi lever nu i en värld där allt du har lagt upp på internet kan säljas för AI-träning - om det inte tas gratis.
Och i takt med att AI utvecklas kommer debatten om dataanvändning och integritet sannolikt att intensifieras.
Företag som äger dataguldgruvor kommer att vinna stort, men till vilken kostnad för den genomsnittliga internetanvändaren?