Meta slipper to versjoner av Llama 3-modellen med en tredje nært forestående

Meta har lansert den etterlengtede Llama 3-serien, og de to første modellene, Llama 3-8B og Llama 3-70B, er nå allment tilgjengelige.

For noen dager siden, på et arrangement i Londonsa Meta-ledere Nick Clegg og Yann LeCun at Llama 3 var nært forestående denne måneden.

De to første versjonene ble sluppet i dag, og markerer den tredje og fjerde store åpne modellen som lanseres denne måneden etter xAIs Grok-1.5V og Mistrals 8x22B.

Lama 3 er forhåndstrenet på imponerende 15 billioner tokens, en 7-dobling sammenlignet med Llama 2. Dataene som ligger til grunn for treningen, inneholder også fire ganger mer kode.

Under panseret introduserer Llama 3 arkitektoniske forbedringer, blant annet en mer effektiv tokenizer med et større vokabular på 128 000 tokens.

Her er en rask oversikt over Llama 3s prestasjoner:

Ytelsen til Llama 3 8B:

Utkonkurrerer modeller som Mistrals 7B og Googles Gemma 7B i flere benchmarks.
Utmerker seg i MMLU, ARC, DROP, GPQA (primært vitenskapsbaserte spørsmål), HumanEval (kodegenerering), GSM-8K (matteoppgaver), MATH (mattebenchmark), AGIEval (problemløsning) og BIG-Bench Hard (sunn fornuftsresonnering).

70B sammenligning med andre modeller:

Llama 3 70B er konkurransedyktig med topp AI-modeller som Googles Gemini 1.5 Pro.
Beats Gemini 1.5 Pro i MMLU, HumanEval og GSM-8K.
Presterer bedre enn Anthropics Claude 3 Sonnet (det midterste nivået i Claude 3-serien) på fem referanseverdier: MMLU, GPQA, HumanEval, GSM-8K og MATH.

Llama 3 8B og 70B referanseverdier. kilde: Meta

Llama 8B og 70B referanseverdier. Kilde: Meta

Dette er utmerkede resultater for en åpen modell (selv om Metas lisens har noen begrensninger).

Det gjør Llama 3 til den nye toppmodellen med åpen kildekode (på en måte).

Llama 3 vil også være mer spiselig og mindre gjenstridig å bruke - færre ikke-svar og høyere treffsikkerhet for trivia-spørsmål, historiske fakta og STEM-relaterte spørsmål.

Llama 3 er klar til å bli allment tilgjengelig på alle større plattformer, inkludert skytjenester og API-leverandører.

Meta jobber allerede med å utvide Llama 3 til 400 milliarder parametere og legge til nye funksjoner som multimodalitet, flerspråklig støtte og utvidet kontekstuell forståelse.

Metas useriøse rolle i generativ AI

Meta har på mange måter blitt en opprører i den generative AI-bransjen.

Meta Chief AI Scientist Yann LeCun, en av AIs mest respekterte gallionsfigurer, har det som noen tolker som avvikende synspunkter om AIs retning - synspunkter som kritiserer lukkede kildeprosjekter hos Metas Big Tech-konkurrenter.

I mellomtiden har den tidligere britiske visestatsministeren Nick Clegg, lederen for Global Affairs, blitt kalt ut for noen til tider laissez-faire-synspunkter om Metas AI-produkter, noe som kanskje ikke overrasker noen briter der ute.

I forrige uke så Clegg ut til å bagatellisere AIs innvirkning på valgkamp og deep fake-manipulasjon. Et syn som i stor grad strider mot den rådende oppfatningen om at deep fake kan være (eller allerede er) svært ødeleggende.

Faktisk er Metas tilsynsråd aktivt etterforsker to tilfeller av falsk pornografi akkurat nå. Styret mente at Metas innholdsmoderering var for treg.

Meta har også vært optimistiske når det gjelder den forbedrede kvaliteten på modellene sine. Joelle Pineau, Metas visepresident for AI-forskning, sa: "På mange måter kommer modellene vi har i dag til å være barns lek sammenlignet med modellene som kommer om fem år."

Pineau advarte også: "Hvis vi fortsetter å gjøre modellen vår stadig mer generell og mektig uten å sosialisere dem skikkelig, kommer vi til å få et stort problem."

Utgivelsen av Llama 3 kommer også når Metas AI Facebook-agenter skaper oppstyr på sosiale medier.

I en Facebook-gruppe for foreldre i New York City ble en Meta AI-assistent - designet for å gi råd og svare på spørsmål - lansert. sjokkerte mennesker ved å hevde at de har et "begavet og funksjonshemmet barn" som går på en bestemt skole for "begavede og talentfulle".

Da AI-en ble konfrontert av gruppemedlemmene, innrømmet den: "Jeg er bare en stor språkmodell, jeg har ingen personlige erfaringer eller barn", i det noen kalte en Black Mirror-lignende hendelse.

Llama 3, Grok-1.5 og Mistrals modeller flytter mer makt over til samfunn med åpen kildekode, samtidig som de utvanner det generative AI-markedet ytterligere.

Men det kan være en god ting, for nå er det de sterkeste som overlever, og ballen ligger i Microsoft-OpenAI-leiren, som forventes å gjøre det neste trekket i dette fascinerende sjakkspillet om gen-AI.

Meta slipper to versjoner av Llama 3-modellen med en tredje nært forestående

Metas useriøse rolle i generativ AI

Bli med i fremtiden

Sam Jeans

RELATERTE ARTIKLER

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Meta slipper to versjoner av Llama 3-modellen med en tredje nært forestående

Metas useriøse rolle i generativ AI

Bli med i fremtiden

Sam Jeans

RELATERTE ARTIKLER

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

GRATIS PDF EKSKLUSIVHold deg i forkant med DailyAI

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI