Meta bygger en avancerad modell för att ta sig an GPT-4

13 september 2023

Meta's LLaMa är en grundläggande, 65 miljarder parametrar stor språkmodell (LLM).

Meta bygger enligt uppgift en avancerad AI-modell som förväntas konkurrera med prestandan hos OpenAI: s GPT-4.

Wall Street Journal rapporterade att Meta i hemlighet har arbetat med den mest avancerade av sina LLM:er och att den förväntas släppas 2024.

Tidigare i år släppte Meta Llama 2, vilket gjorde den fritt tillgänglig för kommersiell och forskningsanvändning. Dess nya modell förväntas också göras fritt tillgänglig i linje med Metas fortsatta open source-strategi för sina AI-produkter.

Metas nya modell ryktas vara flera gånger kraftfullare än Lama 2som redan ligger nära toppen på topplistorna för benchmarking av modeller med öppen tillgång.

Llama 2 släpptes i samarbete med Microsoft på sin Azure-plattform men det verkar som om Meta förbereder sig för att använda sin egen datainfrastruktur i framtiden.

Meta har tagit upp Nvidia H100 GPU:er och kommer att använda sin egen plattform för att träna sin nya modell, istället för att använda Microsofts Azure cloud computing.

Meta var långsam ut ur blocken i AI-loppet men kastar mycket resurser på sina AI-projekt nu. Rapporten sa att den här nya modellen byggdes av ett team som bildades tidigare i år och som hade till uppgift att påskynda Metas AI-ambitioner.

Förhoppningsvis kommer Mark Zuckerberg att erbjuda mer information om den nya modellen vid Meta Connect-evenemanget i slutet av månaden.

Vi kommer sannolikt att höra mer om Meta's AI Personas-projekt också. Zuckerberg föreställer sig mer engagerade interaktioner med AI som kan "producera människoliknande uttryck", något som han ironiskt nog verkar kämpa med.

Om WSJ-rapporten är korrekt kommer Metas nya modell att vara mycket störande för AI-landskapet när den släpps nästa år. En gratis LLM med öppen källkod som är lika kraftfull som GPT-4 kommer att sätta en allvarlig buckla i OpenAI:s förhoppningar om lönsamhet.

Metas strategi att göra sina modeller öppen källkod har dock fått sina juridiska team lite oroliga. Om dåliga aktörer justerar modellen för att ta bort skyddsräcken, skapa desinformation eller bryta mot upphovsrätten, är det oklart vilka juridiska risker Meta potentiellt kan möta.

Det är inte heller klart vilka dataset som används för att träna den nya modellen, men det inkluderar nästan säkert dina interaktioner på Facebook och Instagram.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar