Alibabas Qwen 2.5 er den bedste open source-model inden for matematik og kodning

23. september 2024

  • Alibaba frigav mere end 100 open source-modeller fra sin nye Qwen 2.5-familie
  • Qwen 72B slår Llama 3.1 405B i matematik- og kodningsbenchmarks
  • Alibaba afslørede en ny tekst-til-video-model som en del af sin Tongyi Wanxiang-billedgenerator

Alibaba har frigivet mere end 100 open source AI-modeller, herunder Qwen 2.5 72B, som slår andre open source-modeller i matematik- og kodningsbenchmarks.

En stor del af AI-industriens opmærksomhed på open source-modeller har været rettet mod Metas indsats med Llama 3, men Alibabas Qwen 2.5 har lukket hullet betydeligt. Den nyligt udgivne Qwen 2.5-familie af modeller varierer i størrelse fra 0,5 til 72 milliarder parametre med generaliserede basismodeller såvel som modeller med fokus på meget specifikke opgaver.

Alibaba siger, at disse modeller kommer med "forbedret viden og stærkere evner inden for matematik og kodning" med specialiserede modeller, der fokuserer på kodning, matematik og flere modaliteter, herunder sprog, lyd og syn.

Alibaba Cloud annoncerede også en opgradering af deres egen flagskibsmodel Qwen-Max, som de ikke har frigivet som open source. Qwen 2.5 Max-benchmarks ser gode ud, men det er Qwen 2.5 72B-modellen, der har skabt mest begejstring blandt open source-fans.

Qwen 2.5 72B instruerer modelmatematik og kodningsbenchmarks. Kilde: Alibaba Cloud

Benchmarks viser, at Qwen 2.5 72B slår Metas meget større flagskib. Llama 3.1 405B model på flere fronter, især inden for matematik og kodning. Kløften mellem open source-modeller og proprietære modeller som dem fra OpenAI og Google lukker sig også hurtigt.

Tidlige brugere af Qwen 2.5 72B viser, at modellen kommer lige under Sonnet 3.5 og endda slår OpenAI's o1-modeller i kodning.

Alibaba siger, at disse nye modeller alle blev trænet på deres store datasæt, der omfatter op til 18 billioner tokens. Qwen 2.5-modellerne kommer med et kontekstvindue på op til 128k og kan generere output på op til 8k tokens.

Overgangen til mindre, mere kapable og open source-gratis modeller vil sandsynligvis få større indflydelse på mange brugere end mere avancerede modeller som o1. Disse modellers edge- og on-device-funktioner betyder, at du kan få meget ud af en gratis model, der kører på din bærbare computer.

Den mindre Qwen 2.5-model leverer kodning på GPT-4-niveau til en brøkdel af prisen, eller endda gratis, hvis du har en ordentlig bærbar computer til at køre den lokalt.

Ud over LLM'erne udgav Alibaba en betydelig opdatering af sin visionssprogmodel med introduktionen af Qwen2-VL. Qwen2-VL kan forstå videoer, der varer over 20 minutter, og understøtter videobaseret besvarelse af spørgsmål.

Den er designet til at blive integreret i mobiltelefoner, biler og robotter for at muliggøre automatisering af operationer, der kræver visuel forståelse.

Alibaba afslørede også en ny tekst-til-video-model som en del af sin billedgenerator, Tongyi Wanxiang large model family. Tongyi Wanxiang AI Video kan producere videoindhold i biografkvalitet og 3D-animation med forskellige kunstneriske stilarter baseret på tekstprompter.

Demoerne ser imponerende ud, og værktøjet er gratis at bruge, selv om du skal have et kinesisk mobilnummer for at... Tilmeld dig det her. Sora vil få alvorlig konkurrence, når eller hvis OpenAI på et tidspunkt udgiver den.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser