Meta bygger en avanceret model til at tage kampen op med GPT-4

13. september 2023

Metas LLaMa er en grundlæggende stor sprogmodel (LLM) med 65 milliarder parametre.

Meta er angiveligt ved at opbygge en avanceret AI-model, som forventes at kunne konkurrere med OpenAI's GPT-4.

Wall Street Journal rapporteret at Meta i al hemmelighed har arbejdet på den mest avancerede af sine LLM'er, og at den forventes at blive udgivet i 2024.

Tidligere i år udgav Meta Llama 2 og gjorde den frit tilgængelig til kommerciel og forskningsmæssig brug. Den nye model forventes også at blive gjort frit tilgængelig i overensstemmelse med Metas fortsatte open source-tilgang til sine AI-produkter.

Metas nye model rygtes at være flere gange mere kraftfuld end Lama 2som allerede ligger tæt på toppen af open access model benchmarking leaderboards.

Llama 2 blev udgivet i samarbejde med Microsoft på deres Azure-platform, men det ser ud til, at Meta forbereder sig på at bruge sin egen computerinfrastruktur i fremtiden.

Meta har snuppet en masse Nvidia H100 GPU'er og vil bruge sin egen platform til at træne sin nye model i stedet for at bruge Microsofts Azure cloud computing.

Meta kom langsomt ud af starthullerne i AI-kapløbet, men bruger nu mange ressourcer på sine AI-projekter. Rapporten sagde, at denne nye model blev bygget af et team, der blev dannet tidligere i år og fik til opgave at fremskynde Metas AI-ambitioner.

Forhåbentlig vil Mark Zuckerberg give flere detaljer om den nye model ved Meta Connect-begivenheden i slutningen af måneden.

Vi kommer sandsynligvis også til at høre mere om Metas AI Personas-projekt. Zuckerberg forestiller sig mere engagerede interaktioner med AI, der kan "producere menneskelignende udtryk", noget som han ironisk nok synes at have svært ved.

Hvis WSJ-rapporten er korrekt, vil Metas nye model være meget forstyrrende for AI-landskabet, når den udkommer næste år. En gratis, open source LLM, der er lige så kraftfuld som GPT-4, vil gøre et alvorligt indhug i OpenAI's håb om rentabilitet.

Metas strategi med at gøre sine modeller til open source har dog gjort de juridiske teams lidt bekymrede. Hvis dårlige aktører justerer modellen for at fjerne sikkerhedsforanstaltninger, skabe misinformation eller overtræde ophavsretten, er det uklart, hvilke juridiske risici Meta potentielt kan stå over for.

Det er heller ikke klart, hvilke datasæt der bruges til at træne den nye model, men det omfatter næsten helt sikkert dine interaktioner på Facebook og Instagram.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser