Skulle du ha tillåtit Meta att använda dina Facebook- och Instagram-inlägg för att träna sina AI-modeller? Verkligheten är att du inte hade något val.
Meta bekräftade sin användning av Facebook- och Instagram-data för att träna sin nya AI-assistent.
Tillbaka i augusti sa en talesman att Llama 2 inte utbildades på Metas data och uppgav att modellen "inte utbildades på Meta-användardata, och vi har inte lanserat några generativa AI-konsumentfunktioner på våra system ännu."
Denna inställning förändrades med företagets nya multiplattform generativ AI-assistent, som använder Metas data från människors offentliga inlägg och kommentarer. Meta sa dock att de medvetet har undvikit att använda privata inlägg som delas mellan familj och vänner.
Nick Clegg, Metas president för globala frågor, noterade under företagets årliga Connect-konferens, "Vi har försökt att utesluta dataset som har en tung övervägande av personlig information", tillade han vidare att den "stora majoriteten" av de data som Meta använde för utbildning var allmänt tillgängliga.
Clegg gav ett exempel och nämnde LinkedIn som en plattform vars innehåll Meta medvetet bestämde sig för att inte använda på grund av integritetshänsyn.
Teknikjättar som Meta, OpenAI och Google har nyligen kritiserats för att använda internetdata utan samtycke för att träna sina AI-modeller.
Dessa företag brottas nu med beslut om att använda privat eller upphovsrättsskyddat innehåll i sina AI-system och ställs inför rättsliga utmaningar från författare som anklagar dem för upphovsrättsbrott. Flera högprofilerade författare, inklusive Game of Thrones-skaparen George R.R. Martin, nyligen anslöt sig till en störtflod av stämningar inlämnade mot OpenAI och Meta.
På Meta's Connect-evenemang presenterade VD Mark Zuckerberg Meta AI. Detta verktyg lyftes fram som ett av företagets primära konsumentfokuserade AI-erbjudanden. Till skillnad från tidigare händelser var årets strålkastare främst på AI och flyttade bort från det till stor del nedlagda metaverse förstärkta och virtuella verklighetsprojektet.
Grunden för Meta's AI-assistent ligger i en anpassad modell inspirerad av språkmodellen Llama 2, som de introducerade för offentlig, kommersiell användning i juli. Dessutom utvecklade de Emu, en innovativ modell som är utformad för att skapa bilder baserat på textinmatningar.
Clegg framhöll att AI-träningsprocessen använde text och bilder från offentliga Facebook- och Instagram-inlägg.
En representant från Meta uppgav att Emu-modellen var särskilt utbildad för bildgenerering med hjälp av dessa offentliga inlägg.
Chattfunktionerna baserades å andra sidan på Llama 2-modellen, som kompletterades med några offentligt tillgängliga och kommenterade dataset.
Ur ett säkerhetsperspektiv berättade Clegg att specifika åtgärder vidtagits, till exempel att AI-verktyget inte får generera hyperrealistiska bilder av offentliga personer. När det gäller det omtvistade ämnet upphovsrättsskyddat innehåll sa Clegg: "Vi tror att det är så, men jag misstänker starkt att det kommer att leda till rättstvister."
När man frågade om Metas försiktighetsåtgärder mot replikering av upphovsrättsskyddade bilder pekade en representant från företaget på deras uppdaterade användarvillkor, som strikt förbjuder användare att skapa innehåll som bryter mot integritets- och immateriella normer.