Automattic, firmaet bag WordPress og Tumblr, diskuterer en data- og indholdsaftale med MidJourney og OpenAI.
Denne information, som oprindeligt var dækket af 404 medier og baseret på rapporter fra en unavngiven kilde i Automattic, tyder det på, at en aftale med OpenAI og MidJourney kan være nært forestående.
Dette følger rygter, der cirkulerer på Tumblr om en potentiel aftale med MidJourney, der kunne introducere en ny indtægtsstrøm for platformen.
404 siger, at aftaleprocessen har været rodet indtil videre, herunder en delvist mislykket dataoverførsel til OpenAI og MidJourney, der indeholdt, som en af Tumblrs produktchefer udtrykte det:
"Private indlæg på offentlige blogs, indlæg på slettede eller suspenderede blogs, ubesvarede spørgsmål (normalt er disse ikke offentlige, før de er besvaret), private svar (disse vises kun for modtageren og er ikke offentlige), indlæg, der er markeret som 'eksplicitte' / NSFW / 'modne' efter vores mere moderne standarder (dette er måske ikke en big deal, jeg ved det ikke)."
Konsekvenserne af dette er stadig uklare, og yderligere detaljer om aftalen er på vej.
Guldfeberen for AI-træningsdata går op i en højere enhed
Og lige pludselig er guldfeberen for AI-træningsdata kommet op i et højere gear.
Ja, generative AI-virksomheder har altid haft brug for store mængder data - men de skynder sig nu at betale for dem i stedet for at skrabe dem gratis.
For få dage siden, Reddit diskuterede angiveligt licenserer sit store udvalg af brugergenereret indhold til et endnu ikke afsløret AI-firma, en aftale, der kan være omkring $60 millioner værd årligt. Dette sker, mens Reddit gør sig klar til en børsnotering i marts, hvor man sigter efter en værdiansættelse tæt på $5 milliarder.
Denne potentielle licensaftale er i tråd med en voksende tendens blandt teknologivirksomheder til at sikre legitime aftaler om brug af data, især i lyset af stigende risici for ophavsret.
Igangværende juridiske kampe, som f.eks. Retssag mod New York Timeshar skruet op for nødvendigheden af indhold aftaler.
Automattics skridt til at forhandle med AI-virksomheder rejser spørgsmål om brug af brugergenereret indhold til AI-træning.
De har angiveligt annonceret planer om at introducere en ny funktion, der giver brugerne mulighed for at fravælge, at deres data deles med tredjeparter, herunder AI-firmaer.
Automattic lavede en offentlig erklæring offentliggjort efter 404's rapport, hvor der står: "Vi blokerer i øjeblikket som standard store AI-platformscrawlere - inklusive dem fra de største teknologivirksomheder - og opdaterer vores lister, når nye lanceres," og "deler kun offentligt indhold, der er hostet på WordPress.com og Tumblr fra websteder, der ikke har fravalgt det."
Den fortsætter: "Vi arbejder også direkte med udvalgte AI-virksomheder, så længe deres planer er i overensstemmelse med det, som vores fællesskab lægger vægt på: tilskrivning, fravalg og kontrol."
Men hvis man fravælger, at ens oplysninger bruges til AI-træning, kan det gå ud over brugernes konti.
I en ny FAQ med titlen "Hvad sker der, når du fravælger?" står der: "Hvis du fravælger fra starten, vil vi blokere crawlere fra at få adgang til dit indhold ved at tilføje dit websted til en liste over forbudte sider. Hvis du ombestemmer dig senere, planlægger vi også at opdatere alle partnere om folk, der for nylig har fravalgt, og bede om, at deres indhold fjernes fra tidligere kilder og fremtidig træning."
Vi lever nu i en verden, hvor alt, hvad du har lagt ud på internettet, kan sælges til AI-træningsformål - hvis det ikke er gratis.
Og efterhånden som AI udvikler sig, vil debatten om brug af data og privatlivets fred sandsynligvis blive intensiveret.
Virksomheder, der ejer dataguldminer, står til at vinde stort, men til hvilken pris for den gennemsnitlige internetbruger?