Alibaba lanceert open-source LLM om het op te nemen tegen Meta's Llama 2

7 augustus 2023

Alibaba heeft twee open-source grote taalmodellen uitgebracht op haar cloud computing platform die naar verwachting zullen concurreren met de kleinste versie van Meta's Llama 2 model.

Het Chinese techbedrijf bracht eerder dit jaar zijn Tongyi Qiawen model uit en zegt dat de nieuwe versies, Qwen-7B en Qwen-7B-Chat, afgeslankte versies zijn van die LLM. De "7B" in de modelnamen verwijst naar het feit dat ze zijn getraind op 7 miljard parameters, hetzelfde aantal als waarop de kleinste versie van Meta's Llama 2 is getraind.

Het beschikbaar hebben van voorgetrainde modellen is een enorme tijd- en computerbesparing voor bedrijven die AI-modellen willen gebruiken in hun toepassingen.

Alibaba heeft een vergelijkbare aanpak gekozen voor Meta's release van Llama 2 door zijn kleinere modellen open-source te maken en vrij te implementeren door externe ontwikkelaars. Het bedrijf hoopt dat dit zal leiden tot een grotere adoptie en het in de praktijk testen van zijn modellen.

Net als Meta noemt Alibaba de modellen "open-source", hoewel dat niet helemaal waar is. Het heeft vergelijkbare gebruikseisen als Llama 2, waarbij bedrijven met 100 miljoen gebruikers per maand een licentie van Alibaba nodig hebben.

Hoewel de modellen gratis beschikbaar zijn voor de meeste gebruikers, zal Alibaba financieel voordeel behalen door gebruikers van zijn cloud computing platform te laten betalen om ze te laten werken. Het bedrijf heeft nog geen plannen om zijn grotere model gratis of open-source vrij te geven. Alibaba maakt ook Llama 2 beschikbaar op zijn servers, dus het zal interessant zijn om te zien hoe de adoptie van deze concurrerende modellen verloopt.

Het nieuws over de release komt ongeveer 2 weken nadat Alibaba upgrades aankondigde voor haar cloud computing platform.

Het heeft zijn vectormotor op de datawarehousedienst AnalyticDB waarvan het bedrijf zegt dat het de creatie van generatieve AI-apps een stuk sneller zal maken. Het bedrijf beweert dat vooraf geconfigureerde AI-toepassingen in slechts 30 minuten kunnen worden gebouwd.

De stap van Alibaba is tekenend voor de intensievere AI-race tussen China en de VS. Andere Chinese techgiganten, Huawei en Tencent, hebben ook gewerkt aan hun eigen modellen en aankondigingen op deze fronten worden binnenkort verwacht.

Ondanks de onverzadigbare honger naar AI-toepassingen, zijn de Amerikaanse exportbeperkingen voor chips en wereldwijde tekorten aan high-end GPU's vertragen het tempo van de Chinese AI-ontwikkeling enigszins.

De Chinese AI-regelgeving die volgende week van kracht worden, zullen ook het tempo van generatieve AI-ontwikkelaars vertragen omdat ze zich door het bureaucratische proces van het verkrijgen van AI-vergunningen van de autoriteiten moeten worstelen.

Chinese techbedrijven zoals Alibaba zullen hopen dat ze een aantal van deze uitdagingen kunnen overwinnen en ook buiten hun thuismarkt een grotere adoptie kunnen bereiken. Dat kan aanzienlijk makkelijker zijn dan voor ontwikkelaars van betaalde modellen zoals OpenAI en Google om tractie te vinden in China.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden