Alibaba lanserer LLM med åpen kildekode for å ta opp kampen med Meta's Llama 2

7. august 2023

Alibaba lanserte to store språkmodeller med åpen kildekode på sin cloud computing-plattform, som forventes å konkurrere med den minste versjonen av Metas Llama 2-modell.

Det kinesiske teknologiselskapet ga ut sin Tongyi Qiawen-modell tidligere i år og sier at de nye utgivelsene, Qwen-7B og Qwen-7B-Chat, er nedskalerte versjoner av den LLM. "7B" i modellnavnene refererer til at de er trent på 7 milliarder parametere, som er det samme beløpet som den minste versjonen av Metas Llama 2 ble trent på.

Å ha ferdig opplærte modeller tilgjengelig er en enorm tids- og kostnadsbesparelse for selskaper som ønsker å bruke AI-modeller i applikasjonene sine.

Alibaba har valgt en lignende tilnærming til Metas lansering av Llama 2 ved å gjøre de mindre modellene åpne og gratis å implementere for tredjepartsutviklere. Selskapet håper at dette vil føre til større bruk og testing av modellene i den virkelige verden.

I likhet med Meta omtaler Alibaba modellene som "åpen kildekode", selv om det ikke er helt sant. Den har lignende brukskrav som Llama 2, med selskaper som har 100 millioner brukere per måned som krever lisens fra Alibaba.

Selv om modellene er gratis tilgjengelig for de fleste brukere, vil Alibaba ha økonomiske fordeler ved å ta betalt for å kjøre dem på sin cloud computing-plattform. De har foreløpig ingen planer om å lansere sin større modell gratis eller som åpen kildekode. Alibaba lager også Llama 2 tilgjengelig på serverne sine, så det blir interessant å se hvordan det går med innføringen av disse konkurrerende modellene.

Nyheten om lanseringen kommer omtrent to uker etter at Alibaba kunngjorde oppgraderinger av sin cloud computing-plattform.

Det oppgraderte sin vektormotor på datalagringstjenesten AnalyticDB som selskapet sier vil gjøre det mye raskere å lage generative AI-apper. De hevder at forhåndskonfigurerte AI-applikasjoner kan bygges på så lite som 30 minutter.

Alibabas trekk er et tegn på det intensiverte AI-kappløpet mellom Kina og USA. Andre kinesiske teknologigiganter, Huawei og Tencent, har også jobbet med sine egne modeller, og kunngjøringer på disse frontene er ventet snart.

Til tross for den umettelige appetitten for AI-applikasjoner, har USAs eksportrestriksjoner for chip og global mangel på avanserte GPU-er bremser tempoet i den kinesiske AI-utviklingen noe.

Den Kinesisk regelverk for kunstig intelligens som trer i kraft neste uke, vil også bremse tempoet for utviklere av generativ AI, ettersom de må gjennom den byråkratiske prosessen med å skaffe AI-lisenser fra myndighetene.

Kinesiske teknologiselskaper som Alibaba håper at de kan overvinne noen av disse utfordringene og også oppnå større utbredelse utenfor hjemmemarkedet. Det kan være betydelig enklere enn for utviklere av betalte modeller som OpenAI og Google å få gjennomslag i Kina.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser