O Qwen 2.5 da Alibaba é o melhor modelo de código aberto em matemática e codificação

23 de setembro de 2024

  • A Alibaba lançou mais de 100 modelos de código aberto da sua nova família Qwen 2.5
  • O Qwen 72B vence o Llama 3.1 405B em testes de matemática e codificação
  • A Alibaba revelou um novo modelo de texto para vídeo como parte do seu gerador de imagens Tongyi Wanxiang

A Alibaba lançou mais de 100 modelos de IA de fonte aberta, incluindo o Qwen 2.5 72B, que supera outros modelos de fonte aberta em termos de matemática e de codificação.

Grande parte da atenção da indústria de IA em modelos de código aberto tem sido sobre os esforços da Meta com o Llama 3, mas o Qwen 2.5 da Alibaba fechou a lacuna significativamente. A recém-lançada família de modelos Qwen 2.5 varia em tamanho de 0,5 a 72 bilhões de parâmetros com modelos básicos generalizados, bem como modelos focados em tarefas muito específicas.

A Alibaba afirma que estes modelos vêm com "conhecimentos melhorados e capacidades mais fortes em matemática e codificação", com modelos especializados centrados na codificação, matemática e múltiplas modalidades, incluindo linguagem, áudio e visão.

A Alibaba Cloud também anunciou uma atualização para o seu modelo principal proprietário Qwen-Max, que não foi lançado como código aberto. Os benchmarks do Qwen 2.5 Max parecem bons, mas é o modelo Qwen 2.5 72B que tem gerado a maior parte do entusiasmo entre os fãs do código aberto.

Qwen 2.5 72B instrui modelos de benchmarks de matemática e codificação. Fonte: Alibaba Cloud

Os testes de referência mostram que o Qwen 2.5 72B está a bater o topo de gama muito maior da Meta Lhama 3.1 405B em várias frentes, especialmente em matemática e programação. O fosso entre os modelos de código aberto e os modelos proprietários, como os da OpenAI e da Google, também está a diminuir rapidamente.

Os primeiros utilizadores do Qwen 2.5 72B mostram que o modelo fica apenas a um passo do Sonnet 3.5 e até mesmo do OpenAImodelos o1 da 's na codificação.

Alibaba diz que esses novos modelos foram todos treinados em seu conjunto de dados em grande escala, abrangendo até 18 trilhões de tokens. Os modelos Qwen 2.5 vêm com uma janela de contexto de até 128k e podem gerar saídas de até 8k tokens.

A mudança para modelos gratuitos mais pequenos, mais capazes e de código aberto terá provavelmente um impacto maior em muitos utilizadores do que os modelos mais avançados como o o1. As capacidades de ponta e no dispositivo destes modelos significam que se pode tirar muito partido de um modelo gratuito executado no portátil.

O modelo mais pequeno Qwen 2.5 oferece codificação de nível GPT-4 por uma fração do custo, ou mesmo gratuitamente se tiver um portátil decente para o executar localmente.

Para além dos LLMs, a Alibaba lançou uma atualização significativa do seu modelo de linguagem de visão com a introdução do Qwen2-VL. O Qwen2-VL pode compreender vídeos com duração superior a 20 minutos e suporta respostas a perguntas baseadas em vídeo.

Foi concebido para integração em telemóveis, automóveis e robôs para permitir a automatização de operações que requerem compreensão visual.

A Alibaba também revelou um novo modelo de texto para vídeo como parte do seu gerador de imagens, a grande família de modelos Tongyi Wanxiang. O Tongyi Wanxiang AI Video pode produzir conteúdo de vídeo de qualidade cinematográfica e animação 3D com vários estilos artísticos com base em instruções de texto.

As demos parecem impressionantes e a ferramenta é gratuita, embora seja necessário um número de telemóvel chinês para inscrever-se aqui. Sora vai ter uma concorrência séria quando, ou se, a OpenAI acabar por o lançar.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Eugene van der Watt

Eugene vem de uma formação em engenharia eletrónica e adora tudo o que é tecnologia. Quando faz uma pausa no consumo de notícias sobre IA, pode encontrá-lo à mesa de snooker.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições