Alibaba släpper öppen källkod LLM för att ta på Meta's Llama 2

7 augusti 2023

Alibaba släppte två stora språkmodeller med öppen källkod på sin cloud computing-plattform som förväntas konkurrera med den minsta versionen av Meta's Llama 2-modell.

Det kinesiska teknikföretaget släppte sin Tongyi Qiawen-modell tidigare i år och säger att de nya utgåvorna, Qwen-7B och Qwen-7B-Chat, är avskalade versioner av den LLM. "7B" i modellnamnen hänvisar till att de tränas på 7 miljarder parametrar, vilket är samma mängd som den minsta versionen av Meta's Llama 2 tränades på.

Att ha förtränade modeller tillgängliga innebär en enorm tidsbesparing och minskade datorkostnader för företag som vill använda AI-modeller i sina applikationer.

Alibaba har tagit ett liknande tillvägagångssätt för att Metas lansering av Llama 2 genom att göra sina mindre modeller open-source och fria att implementeras av tredjepartsutvecklare. Företaget hoppas att detta kommer att leda till större användning och testning av modellerna i verkligheten.

Liksom Meta hänvisar Alibaba till modellerna som "öppen källkod" även om det inte är helt sant. Det har liknande användningskrav som Llama 2, med företag som har 100 miljoner användare per månad som kräver en licens från Alibaba.

Även om modellerna är tillgängliga gratis för de flesta användare kommer Alibaba att dra ekonomisk nytta av att debitera användare av sin cloud computing-plattform för att köra dem. Företaget har ännu inga planer på att släppa sin större modell gratis eller med öppen källkod. Alibaba tillverkar också Llama 2 tillgängliga på sina servrar, så det blir intressant att se hur införandet av dessa konkurrerande modeller går.

Nyheten om lanseringen kommer cirka två veckor efter att Alibaba meddelade uppgraderingar av sin cloud computing-plattform.

Bolaget uppgraderade sin vektormotor på sin datalagringstjänst AnalyticDB som företaget säger kommer att göra skapandet av generativa AI-appar mycket snabbare. Företaget hävdar att förkonfigurerade AI-applikationer kan byggas på så lite som 30 minuter.

Alibabas drag är en indikation på den intensifierade AI-kapplöpningen mellan Kina och USA. Andra kinesiska teknikjättar, Huawei och Tencent, har också arbetat med sina egna modeller och tillkännagivanden på dessa fronter väntas snart.

Trots den omättliga aptiten på AI-applikationer har USA:s exportrestriktioner för chip och global brist på avancerade GPU:er saktar ner takten i den kinesiska AI-utvecklingen något.

Den Kinesiska AI-regler som träder i kraft nästa vecka kommer också att sakta ner takten för utvecklare av generativ AI när de ska ta sig igenom den byråkratiska processen för att få AI-licenser från myndigheterna.

Kinesiska teknikföretag som Alibaba kommer att hoppas att de kan övervinna några av dessa utmaningar och också uppnå större antagande utanför sin hemmamarknad. Det kan vara betydligt enklare än för utvecklare av betalda modeller som OpenAI och Google att hitta dragkraft i Kina.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar