Alibaba's Qwen 2.5 is top open-source model in wiskunde en codering

23 september 2024

  • Alibaba geeft meer dan 100 open-source modellen vrij van de nieuwe Qwen 2.5-familie
  • Qwen 72B verslaat Llama 3.1 405B in wiskunde- en coderingsbenchmarks
  • Alibaba heeft een nieuw tekst-naar-videomodel onthuld als onderdeel van de Tongyi Wanxiang-afbeeldingsgenerator

Alibaba heeft meer dan 100 open-source AI-modellen vrijgegeven, waaronder Qwen 2.5 72B die andere open-source modellen verslaat in wiskunde en coderingsbenchmarks.

Veel van de aandacht van de AI-industrie in open-source modellen ging uit naar de inspanningen van Meta met Llama 3, maar Qwen 2.5 van Alibaba heeft de kloof aanzienlijk gedicht. De onlangs uitgebrachte Qwen 2.5 familie van modellen varieert in grootte van 0,5 tot 72 miljard parameters met zowel algemene basismodellen als modellen die zich richten op zeer specifieke taken.

Alibaba zegt dat deze modellen worden geleverd met "verbeterde kennis en sterkere capaciteiten in wiskunde en codering" met gespecialiseerde modellen die zich richten op codering, wiskunde en meerdere modaliteiten, waaronder taal, audio en beeld.

Alibaba Cloud kondigde ook een upgrade aan van zijn eigen vlaggenschipmodel Qwen-Max, dat het niet heeft vrijgegeven als open-source. De Qwen 2.5 Max benchmarks zien er goed uit, maar het is het Qwen 2.5 72B model dat de meeste opwinding heeft gegenereerd onder open-source fans.

Qwen 2.5 72B instructiemodel wiskunde en codering benchmarks. Bron: Alibaba Cloud

Uit de benchmarks blijkt dat Qwen 2.5 72B het veel grotere vlaggenschip van Meta verslaat Lama 3.1 405B model op verschillende fronten, vooral in wiskunde en codering. De kloof tussen open-source modellen en propriëtaire modellen zoals die van OpenAI en Google wordt ook steeds kleiner.

Vroege gebruikers van Qwen 2.5 72B laten zien dat het model net niet kan tippen aan Sonnet 3.5 en zelfs Sonnet 3.5 verslaat. OpenAIo1-modellen in codering.

Alibaba zegt dat deze nieuwe modellen allemaal zijn getraind op haar grootschalige dataset die tot 18 biljoen tokens omvat. De Qwen 2.5 modellen worden geleverd met een contextvenster tot 128k en kunnen outputs genereren tot 8k tokens.

De overstap naar kleinere, meer capabele en open-source gratis modellen zal waarschijnlijk een grotere impact hebben op veel gebruikers dan meer geavanceerde modellen zoals o1. De edge en on-device mogelijkheden van deze modellen betekenen dat je veel kunt halen uit een gratis model dat op je laptop draait.

Het kleinere Qwen 2.5 model levert GPT-4 niveau codering voor een fractie van de kosten, of zelfs gratis als je een fatsoenlijke laptop hebt om het lokaal te draaien.

Naast de LLM's heeft Alibaba een belangrijke update uitgebracht voor zijn vision taalmodel met de introductie van Qwen2-VL. Qwen2-VL kan video's van meer dan 20 minuten begrijpen en ondersteunt videogebaseerde vraagbeantwoording.

Het is ontworpen voor integratie in mobiele telefoons, auto's en robots om handelingen te automatiseren die visueel begrip vereisen.

Alibaba heeft ook een nieuw tekst-naar-videomodel onthuld als onderdeel van de Tongyi Wanxiang-familie van beeldgeneratoren. Tongyi Wanxiang AI Video kan video-inhoud van bioscoopkwaliteit en 3D-animaties met verschillende artistieke stijlen produceren op basis van tekstaanwijzingen.

De demo's zien er indrukwekkend uit en de tool is gratis te gebruiken, hoewel je een Chinees mobiel nummer nodig hebt om meld je hier aan. Sora zal serieuze concurrentie krijgen wanneer, of als, OpenAI het uiteindelijk uitbrengt.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden