Ville du have givet Meta lov til at bruge dine Facebook- og Instagram-opslag til at træne deres AI-modeller? Virkeligheden er, at du ikke havde noget valg.
Meta bekræftede, at de bruger Facebook- og Instagram-data til at træne deres nye AI-assistent.
Tilbage i august sagde en talsmand, at Llama 2 ikke var trænet på Metas data, og sagde, at modellen "ikke var trænet på Meta-brugerdata, og vi har ikke lanceret nogen generative AI-forbrugerfunktioner på vores systemer endnu."
Denne holdning ændrede sig med virksomhedens nye multi-platform generativ AI-assistentsom bruger Metas data fra folks offentlige indlæg og kommentarer. Meta siger dog, at de bevidst har undgået at bruge private indlæg, der deles mellem familie og venner.
Nick Clegg, Metas præsident for globale anliggender, bemærkede under virksomhedens årlige Connect-konference: "Vi har forsøgt at udelukke datasæt, der har en stor overvægt af personlige oplysninger," Han tilføjede desuden, at "langt størstedelen" af de data, som Meta brugte til træning, var offentligt tilgængelige.
Clegg gav et eksempel og nævnte LinkedIn som en platform, hvis indhold Meta bevidst besluttede ikke at bruge på grund af bekymringer om privatlivets fred.
Teknologigiganter som Meta, OpenAI og Google er for nylig blevet kritiseret for at bruge internetdata uden samtykke til at træne deres AI-modeller.
Disse virksomheder kæmper nu med beslutninger om at bruge privat eller ophavsretligt beskyttet indhold i deres AI-systemer og står over for juridiske udfordringer fra forfattere, der anklager dem for brud på ophavsretten. Flere højt profilerede forfattere, herunder Game of Thrones-skaberen George R.R. Martin, har for nylig kom med i en syndflod af retssager indgivet mod OpenAI og Meta.
På Metas Connect-begivenhed afslørede CEO Mark Zuckerberg Meta AI. Dette værktøj blev fremhævet som et af virksomhedens primære forbrugerfokuserede AI-tilbud. I modsætning til tidligere begivenheder var dette års fokus primært på AI og bevægede sig væk fra det stort set nedlagte metaverse augmented og virtual reality-projekt.
Grundlaget for Metas AI-assistent er en tilpasset model, der er inspireret af sprogmodellen Llama 2, som de introducerede til offentlig, kommerciel brug i juli. Derudover har de udviklet Emu, en innovativ model, der er designet til at skabe billeder baseret på tekstinput.
Clegg understregede, at denne AI-træningsproces brugte tekst og billeder fra offentlige Facebook- og Instagram-opslag.
En repræsentant fra Meta sagde, at Emu-modellen var specifikt trænet til billedgenerering ved hjælp af disse offentlige opslag.
Chatfunktionerne var på den anden side baseret på Llama 2-modellen, som blev suppleret med nogle offentligt tilgængelige og kommenterede datasæt.
Fra et sikkerhedsperspektiv fortalte Clegg, at der var indført specifikke foranstaltninger, som f.eks. at forbyde AI-værktøjet at generere hyperrealistiske billeder af offentlige personligheder. Med hensyn til det omstridte emne om ophavsretligt beskyttet indhold sagde Clegg: "Det tror vi, det er, men jeg har en stærk mistanke om, at det kommer til at udspille sig i retssager."
Da vi spurgte til Metas forholdsregler mod kopiering af ophavsretligt beskyttede billeder, pegede en repræsentant fra virksomheden på deres opdaterede servicevilkår, som strengt forbyder brugerne at skabe indhold, der overtræder normerne for privatlivets fred og intellektuel ejendomsret.