Alibaba har frigivet mere end 100 open source AI-modeller, herunder Qwen 2.5 72B, som slår andre open source-modeller i matematik- og kodningsbenchmarks.
En stor del af AI-industriens opmærksomhed på open source-modeller har været rettet mod Metas indsats med Llama 3, men Alibabas Qwen 2.5 har lukket hullet betydeligt. Den nyligt udgivne Qwen 2.5-familie af modeller varierer i størrelse fra 0,5 til 72 milliarder parametre med generaliserede basismodeller såvel som modeller med fokus på meget specifikke opgaver.
Alibaba siger, at disse modeller kommer med "forbedret viden og stærkere evner inden for matematik og kodning" med specialiserede modeller, der fokuserer på kodning, matematik og flere modaliteter, herunder sprog, lyd og syn.
Alibaba Cloud annoncerede også en opgradering af deres egen flagskibsmodel Qwen-Max, som de ikke har frigivet som open source. Qwen 2.5 Max-benchmarks ser gode ud, men det er Qwen 2.5 72B-modellen, der har skabt mest begejstring blandt open source-fans.
Benchmarks viser, at Qwen 2.5 72B slår Metas meget større flagskib. Llama 3.1 405B model på flere fronter, især inden for matematik og kodning. Kløften mellem open source-modeller og proprietære modeller som dem fra OpenAI og Google lukker sig også hurtigt.
Tidlige brugere af Qwen 2.5 72B viser, at modellen kommer lige under Sonnet 3.5 og endda slår OpenAI's o1-modeller i kodning.
Open source Qwen 2.5 slår o1-modeller på kodning 🤯🤯
Qwen 2.5 scorer højere end o1-modellerne på kodning på Livebench AI
Qwen ligger lige under Sonnet 3.5, og for en open source-tilstand er det fantastisk!!!
o1 er god til hård kodning, men elendig til kodekompletteringsproblemer og... pic.twitter.com/iazam61eP9
- Bindu Reddy (@bindureddy) 20. september 2024
Alibaba siger, at disse nye modeller alle blev trænet på deres store datasæt, der omfatter op til 18 billioner tokens. Qwen 2.5-modellerne kommer med et kontekstvindue på op til 128k og kan generere output på op til 8k tokens.
Overgangen til mindre, mere kapable og open source-gratis modeller vil sandsynligvis få større indflydelse på mange brugere end mere avancerede modeller som o1. Disse modellers edge- og on-device-funktioner betyder, at du kan få meget ud af en gratis model, der kører på din bærbare computer.
Den mindre Qwen 2.5-model leverer kodning på GPT-4-niveau til en brøkdel af prisen, eller endda gratis, hvis du har en ordentlig bærbar computer til at køre den lokalt.
Vi har GPT-4 til kodning derhjemme! Jeg slog op på OpenAI?ref_src=twsrc%5Etfw”>@OpenAI GPT-4 0613-resultater for forskellige benchmarks og sammenlignet dem med @Alibaba_Qwen 2,5 7B-koder. 👀
> 15 måneder efter udgivelsen af GPT-0613 har vi en åben LLM under Apache 2.0, som fungerer lige så godt. 🤯
> GPT-4-priser... pic.twitter.com/2szw5kwTe5
- Philipp Schmid (@_philschmid) 22. september 2024
Ud over LLM'erne udgav Alibaba en betydelig opdatering af sin visionssprogmodel med introduktionen af Qwen2-VL. Qwen2-VL kan forstå videoer, der varer over 20 minutter, og understøtter videobaseret besvarelse af spørgsmål.
Den er designet til at blive integreret i mobiltelefoner, biler og robotter for at muliggøre automatisering af operationer, der kræver visuel forståelse.
Alibaba afslørede også en ny tekst-til-video-model som en del af sin billedgenerator, Tongyi Wanxiang large model family. Tongyi Wanxiang AI Video kan producere videoindhold i biografkvalitet og 3D-animation med forskellige kunstneriske stilarter baseret på tekstprompter.
Demoerne ser imponerende ud, og værktøjet er gratis at bruge, selv om du skal have et kinesisk mobilnummer for at... Tilmeld dig det her. Sora vil få alvorlig konkurrence, når eller hvis OpenAI på et tidspunkt udgiver den.