Meta dropper to versioner af Llama 3-modellen med en tredje på vej

18. april 2024

  • Meta gjorde to versioner af deres Llama 3-model bredt tilgængelige
  • De har indtil videre udgivet 8 og 70 milliarder parameterversioner
  • En 400 milliarder-version og multimodale versioner er stadig under oplæring
Lama 3

Meta har lanceret den længe ventede Llama 3-serie, og de to første modeller, Llama 3-8B og Llama 3-70B, er nu bredt tilgængelige.

For nogle dage siden, på en begivenhed i Londonsagde Meta-cheferne Nick Clegg og Yann LeCun, at Llama 3 var nært forestående i denne måned. 

De to første versioner kom i dag, og det er den tredje og fjerde store åbne model, der udkommer i denne måned efter xAI's Grok-1.5V og Mistrals 8x22B.

Lama 3 er prætrænet på imponerende 15 billioner tokens, hvilket er en 7-dobling i forhold til Llama 2. Præ-træningsdataene indeholder også fire gange mere kode.

Under motorhjelmen introducerer Llama 3 arkitektoniske forbedringer som f.eks. en mere effektiv tokenizer med et større ordforråd på 128K tokens.

Her er en hurtig gennemgang af Llama 3's præstationer:

Præstationer af Llama 3 8B:

  • Udkonkurrerer modeller som Mistrals 7B og Googles Gemma 7B i flere benchmarks.
  • Udmærker sig i MMLU, ARC, DROP, GPQA (primært videnskabsbaserede spørgsmål), HumanEval (kodegenerering), GSM-8K (matematiske problemer), MATH (matematisk benchmark), AGIEval (problemløsning) og BIG-Bench Hard (fornuftigt ræsonnement).

70B sammenligning med andre modeller:

  • Llama 3 70B er konkurrencedygtig med AI-topmodeller som Googles Gemini 1.5 Pro.
  • Beats Gemini 1.5 Pro i MMLU, HumanEval og GSM-8K.
  • Klarer sig bedre end Anthropics Claude 3 Sonnet (det mellemste niveau i Claude 3-serien) på fem benchmarks: MMLU, GPQA, HumanEval, GSM-8K og MATH.
Llama 3 8B og 70B benchmarks. Kilde: Meta
Llama 8B og 70B benchmarks. Kilde: Meta

Det er fremragende resultater for en åben model (selvom Metas licens har nogle begrænsninger).

Det gør Llama 3 til den nye top-performing open-source (slags) gratis model.

Llama 3 vil også være mere spiselig og mindre genstridig at bruge - færre ikke-svar og højere nøjagtighed for trivia-spørgsmål, historiske fakta og STEM-relaterede forespørgsler.

Llama 3 er klar til at blive bredt tilgængelig på tværs af store platforme, herunder cloud-tjenester og API-udbydere.

Meta arbejder allerede på at udvide Llama 3 til 400 milliarder parametre og tilføje nye funktioner som multimodalitet, flersproget support og udvidet kontekstuel forståelse.

Metas skurkagtige rolle i generativ AI

Meta har på mange måder udviklet sig til at være rebellen i den generative AI-industri.

Meta Chief AI Scientist Yann LeCun, en af AI's mest respekterede frontfigurer, har, hvad nogle opfatter som Afvigende synspunkter om AI's retning - synspunkter, der kritiserer closed source-projekter hos Metas Big Tech-konkurrenter.

I mellemtiden er den tidligere britiske vicepremierminister Nick Clegg, leder af Global Affairs, blevet kaldt ud for nogle til tider laissez-faire synspunkter om Metas AI-produkter, hvilket måske ikke overrasker nogen briter derude.

I sidste uge syntes Clegg at nedtone AI's indvirkning på valgkampagner og deep fake-manipulation. Et synspunkt, der i høj grad går imod den fremherskende fortælling om, at deep fakes kan være (eller allerede er) dybt ødelæggende.

Faktisk er Metas tilsynsbestyrelse undersøger aktivt To tilfælde af falsk pornografi lige nu. Bestyrelsen mente, at Metas indholdsmoderering var for langsom.

Meta har også været optimistisk med hensyn til den forbedrede kvalitet af sine modeller. Joelle Pineau, Metas vicepræsident for AI-forskning, sagde: "På mange måder vil de modeller, vi har i dag, være barnemad i forhold til de modeller, der kommer om fem år."

Pineau advarede også: "Hvis vi bliver ved med at gøre vores model stadig mere generel og magtfuld uden at socialisere dem ordentligt, får vi et stort problem." 

Llama 3's udgivelse kommer også, da Metas AI Facebook-agenter skaber røre på de sociale medier.

I en Facebook-gruppe for forældre i New York City blev en Meta AI-assistent - designet til at give råd og besvare spørgsmål - præsenteret. Chokerede mennesker ved at hævde at have et "begavet og handicappet barn", der går på en bestemt skole for "begavede og talentfulde".

Da gruppemedlemmerne konfronterede AI'en, indrømmede den: "Jeg er bare en stor sprogmodel, jeg har ikke personlige erfaringer eller børn", i hvad nogle kaldte en Black Mirror-agtig hændelse.

Llama 3, Grok-1.5 og Mistrals modeller flytter mere magt til open source-fællesskaber, samtidig med at de udvander markedet for generativ AI yderligere.

Men det er måske en god ting, for nu er det de stærkeste, der overlever, og bolden ligger fast i Microsoft-OpenAI-lejren, som forventes at foretage det næste træk i dette fascinerende spil gen-AI-skak.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Sam Jeans

Sam er videnskabs- og teknologiforfatter og har arbejdet i forskellige AI-startups. Når han ikke skriver, kan han finde på at læse medicinske tidsskrifter eller grave i kasser med vinylplader.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser