Alibaba har frigivet to store open source-sprogmodeller på sin cloud computing-platform, som forventes at konkurrere med den mindste version af Metas Llama 2-model.
Den kinesiske teknologivirksomhed udgav sin Tongyi Qiawen-model tidligere i år og siger, at de nye udgivelser, Qwen-7B og Qwen-7B-Chat, er nedbarberede versioner af denne LLM. "7B" i modelnavnene henviser til, at de er trænet på 7 milliarder parametre, hvilket er den samme mængde, som den mindste version af Meta's Llama 2 blev trænet på.
At have foruddannede modeller til rådighed er en enorm besparelse i tid og computerudgifter for virksomheder, der ønsker at bruge AI-modeller i deres applikationer.
Alibaba har valgt en lignende tilgang til Metas udgivelse af Llama 2 ved at gøre sine mindre modeller open source og gratis at implementere for tredjepartsudviklere. Virksomheden håber, at det vil resultere i større udbredelse og testning af modellerne i den virkelige verden.
Ligesom Meta omtaler Alibaba modellerne som "open source", selvom det ikke er helt sandt. Den har lignende brugskrav som Llama 2, og virksomheder, der har 100 millioner brugere om måneden, skal have en licens fra Alibaba.
Mens modellerne er gratis tilgængelige for de fleste brugere, vil Alibaba drage økonomisk fordel af at opkræve betaling fra brugerne af sin cloud computing-platform for at køre dem. De har endnu ingen planer om at frigive deres større model gratis eller som open source. Alibaba laver også Llama 2 tilgængelig på sine servere, så det bliver interessant at se, hvordan det går med indførelsen af disse konkurrerende modeller.
Nyheden om udgivelsen kommer ca. 2 uger efter, at Alibaba annoncerede opgraderinger af sin cloud computing-platform.
Den opgraderede sin vektormotor på sin AnalyticDB-datalagringstjeneste som ifølge virksomheden vil gøre det meget hurtigere at skabe generative AI-apps. De hævder, at forudkonfigurerede AI-applikationer kan bygges på så lidt som 30 minutter.
Alibabas træk er et tegn på det intensiverede AI-kapløb mellem Kina og USA. Andre kinesiske tech-giganter, Huawei og Tencent, har også arbejdet på deres egne modeller, og der forventes snart udmeldinger på disse fronter.
På trods af den umættelige appetit på AI-applikationer har USA's eksportrestriktioner for chips og global mangel på high-end GPU'er sænker tempoet i den kinesiske AI-udvikling noget.
Den Kinesiske AI-regler der træder i kraft i næste uge, vil også sænke tempoet for udviklere af generativ AI, når de skal igennem den bureaukratiske proces med at få AI-licenser fra myndighederne.
Kinesiske teknologivirksomheder som Alibaba vil håbe, at de kan overvinde nogle af disse udfordringer og også opnå større udbredelse uden for deres hjemmemarked. Det kan være betydeligt lettere end for udviklere af betalingsmodeller som OpenAI og Google at finde fodfæste i Kina.