Meta bygger en avansert modell for å ta opp kampen med GPT-4

13. september 2023

Metas LLaMa er en grunnleggende, 65 milliarder parametere stor språkmodell (LLM).

Meta bygger angivelig en avansert AI-modell som forventes å kunne konkurrere med ytelsen til OpenAIs GPT-4.

Wall Street Journal rapportert at Meta i all hemmelighet har jobbet med den mest avanserte av sine LLM-er, og at den forventes å bli lansert i 2024.

Tidligere i år lanserte Meta Llama 2, og gjorde den fritt tilgjengelig for kommersiell og forskningsmessig bruk. Den nye modellen forventes også å bli gjort fritt tilgjengelig i tråd med Metas fortsatte åpen kildekode-tilnærming til sine AI-produkter.

Det ryktes at Metas nye modell skal være flere ganger kraftigere enn Lama 2som allerede ligger nær toppen av ranglistene for benchmarking av åpne modeller.

Llama 2 ble utgitt i samarbeid med Microsoft på Azure-plattformen, men det ser ut til at Meta forbereder seg på å bruke sin egen databehandlingsinfrastruktur i fremtiden.

Meta har snappet opp Nvidia H100 GPU-er og vil bruke sin egen plattform til å trene opp den nye modellen, i stedet for å bruke Microsofts Azure-sky.

Meta var treg ut av blokkene i AI-løpet, men kaster mye ressurser på sine AI-prosjekter nå. Rapporten sa at denne nye modellen ble bygget av et team som ble dannet tidligere i år og fikk i oppgave å akselerere Metas AI-ambisjoner.

Forhåpentligvis vil Mark Zuckerberg tilby flere detaljer om den nye modellen på Meta Connect-arrangementet i slutten av måneden.

Vi kommer sannsynligvis til å høre mer om Metas AI Personas-prosjekt også. Zuckerberg ser for seg mer engasjerte interaksjoner med AI som kan "produsere menneskelignende uttrykk", noe han ironisk nok ser ut til å slite med.

Hvis WSJ-rapporten er korrekt, vil Metas nye modell være svært forstyrrende for AI-landskapet når den lanseres neste år. En gratis LLM med åpen kildekode som er like kraftig som GPT-4, vil gjøre et alvorlig innhugg i OpenAIs håp om lønnsomhet.

Metas strategi om å gjøre modellene sine åpen kildekode har imidlertid fått sine juridiske team litt bekymret. Hvis dårlige skuespillere justerer modellen for å fjerne rekkverk, skape desinformasjon eller bryte opphavsretten, er det uklart hvilke juridiske risikoer Meta potensielt kan møte.

Det er heller ikke klart hvilke datasett som brukes til å trene opp den nye modellen, men den inkluderer nesten helt sikkert interaksjonene dine på Facebook og Instagram.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser