Qwen 2.5 d'Alibaba est le meilleur modèle open-source en mathématiques et en codage

23 septembre 2024

  • Alibaba a publié plus de 100 modèles open-source de sa nouvelle famille Qwen 2.5.
  • Qwen 72B bat Llama 3.1 405B dans les tests de mathématiques et de codage
  • Alibaba a dévoilé un nouveau modèle de conversion de texte en vidéo dans le cadre de son générateur d'images Tongyi Wanxiang.

Alibaba a publié plus de 100 modèles d'IA en code source libre, dont Qwen 2.5 72B, qui surpasse d'autres modèles en code source libre dans les tests de mathématiques et de codage.

L'attention de l'industrie de l'IA en matière de modèles open-source s'est concentrée sur les efforts de Meta avec Llama 3, mais Qwen 2.5 d'Alibaba a considérablement réduit l'écart. La famille de modèles Qwen 2.5, qui vient d'être publiée, comprend de 0,5 à 72 milliards de paramètres, avec des modèles de base généralisés et des modèles axés sur des tâches très spécifiques.

Alibaba affirme que ces modèles sont dotés de "connaissances améliorées et de capacités plus fortes en mathématiques et en codage", avec des modèles spécialisés axés sur le codage, les mathématiques et de multiples modalités, notamment le langage, l'audio et la vision.

Alibaba Cloud a également annoncé une mise à jour de son modèle phare propriétaire Qwen-Max, qu'il n'a pas publié en open-source. Les benchmarks du Qwen 2.5 Max semblent bons, mais c'est le modèle Qwen 2.5 72B qui a suscité le plus d'enthousiasme parmi les fans de logiciels libres.

Qwen 2.5 72B instruct model maths et coding benchmarks. Source : Alibaba Cloud

Les benchmarks montrent que Qwen 2.5 72B bat le vaisseau amiral de Meta, qui est beaucoup plus grand. Llama 3.1 405B sur plusieurs fronts, en particulier dans les domaines des mathématiques et du codage. L'écart entre les modèles à code source ouvert et les modèles propriétaires tels que ceux d'OpenAI et de Google se réduit également rapidement.

Les premiers utilisateurs de Qwen 2.5 72B montrent que le modèle se situe juste en dessous de Sonnet 3.5 et qu'il le bat même. OpenAIModèles o1 dans la codification.

Alibaba précise que ces nouveaux modèles ont tous été entraînés sur son ensemble de données à grande échelle comprenant jusqu'à 18 billions de jetons. Les modèles Qwen 2.5 sont dotés d'une fenêtre contextuelle allant jusqu'à 128k et peuvent générer des sorties allant jusqu'à 8k tokens.

Le passage à des modèles gratuits plus petits, plus performants et à code source ouvert aura probablement un impact plus important sur un grand nombre d'utilisateurs que les modèles plus avancés comme o1. Les capacités marginales et sur appareil de ces modèles signifient que vous pouvez tirer beaucoup de profit d'un modèle gratuit fonctionnant sur votre ordinateur portable.

Le modèle Qwen 2.5, plus petit, offre un codage de niveau GPT-4 pour une fraction du prix, voire gratuitement si vous disposez d'un ordinateur portable décent pour l'exécuter localement.

Outre les LLM, Alibaba a publié une mise à jour importante de son modèle de langage de vision avec l'introduction de Qwen2-VL. Qwen2-VL peut comprendre des vidéos de plus de 20 minutes et prend en charge les questions-réponses basées sur la vidéo.

Il est conçu pour être intégré dans les téléphones mobiles, les automobiles et les robots afin de permettre l'automatisation des opérations qui nécessitent une compréhension visuelle.

Alibaba a également dévoilé un nouveau modèle de conversion de texte en vidéo dans le cadre de son générateur d'images, la grande famille de modèles Tongyi Wanxiang. Tongyi Wanxiang AI Video peut produire des contenus vidéo de qualité cinématographique et des animations 3D de différents styles artistiques à partir de textes.

Les démonstrations sont impressionnantes et l'utilisation de l'outil est gratuite, bien que vous ayez besoin d'un numéro de téléphone portable chinois pour l'utiliser. inscrivez-vous ici. Sora va avoir une sérieuse concurrence quand, ou si, OpenAI le met sur le marché.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Eugène van der Watt

Eugene a une formation d'ingénieur en électronique et adore tout ce qui touche à la technologie. Lorsqu'il fait une pause dans sa consommation d'informations sur l'IA, vous le trouverez à la table de snooker.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation