Qwen 2.5 de Alibaba es el mejor modelo de código abierto en matemáticas y codificación

23 de septiembre de 2024

  • Alibaba publica más de 100 modelos de código abierto de su nueva familia Qwen 2.5
  • Qwen 72B supera a Llama 3.1 405B en pruebas matemáticas y de codificación
  • Alibaba presenta un nuevo modelo de conversión de texto en vídeo como parte de su generador de imágenes Tongyi Wanxiang

Alibaba ha publicado más de 100 modelos de IA de código abierto, entre ellos Qwen 2.5 72B, que supera a otros modelos de código abierto en pruebas matemáticas y de codificación.

Gran parte de la atención de la industria de la IA en modelos de código abierto se ha centrado en los esfuerzos de Meta con Llama 3, pero Qwen 2.5 de Alibaba ha acortado distancias de forma significativa. La recién estrenada familia de modelos Qwen 2.5 tiene un tamaño que va de 0,5 a 72.000 millones de parámetros, con modelos base generalizados y modelos centrados en tareas muy específicas.

Alibaba afirma que estos modelos vienen con "conocimientos mejorados y capacidades más sólidas en matemáticas y codificación", con modelos especializados centrados en la codificación, las matemáticas y múltiples modalidades, como el lenguaje, el audio y la visión.

Alibaba Cloud también ha anunciado una actualización de su modelo insignia Qwen-Max, que no ha publicado como código abierto. Los benchmarks de Qwen 2.5 Max tienen buena pinta, pero es el modelo Qwen 2.5 72B el que ha generado más expectación entre los aficionados al código abierto.

Qwen 2.5 72B instruye a los modelos de referencia de matemáticas y codificación. Fuente: Alibaba Cloud

Las pruebas muestran que Qwen 2.5 72B supera al buque insignia de Meta, mucho más grande. Llama 3.1 405B en varios frentes, especialmente en matemáticas y codificación. La brecha entre los modelos de código abierto y los propietarios, como los de OpenAI y Google, también se está cerrando rápidamente.

Los primeros usuarios de Qwen 2.5 72B muestran que el modelo se sitúa justo por debajo de Sonnet 3.5 e incluso supera a OpenAImodelos o1 en codificación.

Alibaba afirma que estos nuevos modelos se han entrenado con su conjunto de datos a gran escala, que abarca hasta 18 billones de tokens. Los modelos Qwen 2.5 vienen con una ventana de contexto de hasta 128k y pueden generar resultados de hasta 8k tokens.

El paso a modelos libres más pequeños, más capaces y de código abierto tendrá probablemente un mayor impacto en muchos usuarios que los modelos más avanzados como o1. Las capacidades de borde y en el dispositivo de estos modelos significan que se puede obtener una gran cantidad de kilometraje de un modelo libre que se ejecuta en su ordenador portátil.

El modelo Qwen 2.5, más pequeño, ofrece codificación de nivel GPT-4 por una fracción del coste, o incluso gratis si tienes un portátil decente para ejecutarlo localmente.

Además de los LLM, Alibaba ha lanzado una importante actualización de su modelo de lenguaje de visión con la introducción de Qwen2-VL. Qwen2-VL puede comprender vídeos de más de 20 minutos y responder a preguntas en vídeo.

Está diseñado para su integración en teléfonos móviles, automóviles y robots con el fin de permitir la automatización de operaciones que requieren comprensión visual.

Alibaba también presentó un nuevo modelo de texto a vídeo como parte de su generador de imágenes, la gran familia de modelos Tongyi Wanxiang. Tongyi Wanxiang AI Video puede producir contenidos de vídeo de calidad cinematográfica y animación 3D con diversos estilos artísticos a partir de indicaciones de texto.

Las demostraciones son impresionantes y la herramienta es gratuita, aunque se necesita un número de móvil chino para acceder a ella. inscríbase aquí. Sora va a tener una seria competencia cuando, o si, OpenAI finalmente lo lance.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Eugene van der Watt

Eugene es ingeniero electrónico y le encanta todo lo relacionado con la tecnología. Cuando descansa de consumir noticias sobre IA, lo encontrará jugando al billar.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales