Qwen 2.5 di Alibaba è il modello open-source di punta in matematica e codifica

23 settembre 2024

  • Alibaba ha rilasciato più di 100 modelli open-source della sua nuova famiglia Qwen 2.5
  • Qwen 72B batte Llama 3.1 405B nei benchmark di matematica e codifica
  • Alibaba ha presentato un nuovo modello di text-to-video come parte del suo generatore di immagini Tongyi Wanxiang

Alibaba ha rilasciato più di 100 modelli di intelligenza artificiale open-source, tra cui Qwen 2.5 72B che batte altri modelli open-source nei benchmark matematici e di codifica.

Gran parte dell'attenzione dell'industria dell'intelligenza artificiale sui modelli open-source è stata rivolta agli sforzi di Meta con Llama 3, ma Qwen 2.5 di Alibaba ha colmato il divario in modo significativo. La famiglia di modelli Qwen 2.5, appena rilasciata, ha dimensioni che vanno da 0,5 a 72 miliardi di parametri, con modelli di base generalizzati e modelli focalizzati su compiti molto specifici.

Alibaba afferma che questi modelli sono dotati di "conoscenze migliorate e capacità più forti in matematica e codifica", con modelli specializzati che si concentrano su codifica, matematica e modalità multiple, tra cui linguaggio, audio e visione.

Alibaba Cloud ha anche annunciato un aggiornamento del suo modello di punta proprietario Qwen-Max, che non ha rilasciato come open-source. I benchmark del Qwen 2.5 Max sembrano buoni, ma è il modello Qwen 2.5 72B che ha generato la maggior parte dell'entusiasmo tra i fan dell'open-source.

Qwen 2.5 72B istruisce i benchmark dei modelli di matematica e codifica. Fonte: Alibaba Cloud

I benchmark mostrano che Qwen 2.5 72B batte l'ammiraglia Meta, molto più grande. Lama 3.1 405B modello su diversi fronti, soprattutto in matematica e codifica. Anche il divario tra i modelli open-source e quelli proprietari, come quelli di OpenAI e Google, si sta riducendo rapidamente.

I primi utilizzatori di Qwen 2.5 72B mostrano che il modello è appena inferiore a Sonnet 3.5 e persino superiore a Sonnet 3.5. OpenAImodelli o1 nella codifica.

Alibaba afferma che tutti i nuovi modelli sono stati addestrati sul suo set di dati su larga scala che comprende fino a 18 trilioni di token. I modelli Qwen 2.5 hanno una finestra di contesto fino a 128k e possono generare output fino a 8k token.

Il passaggio a modelli gratuiti più piccoli, più capaci e open-source avrà probabilmente un impatto più ampio su molti utenti rispetto a modelli più avanzati come o1. Le funzionalità edge e on-device di questi modelli significano che si può ottenere molto da un modello gratuito in esecuzione sul proprio laptop.

Il modello più piccolo Qwen 2.5 offre una codifica di livello GPT-4 a una frazione del costo, o addirittura gratis se si dispone di un laptop decente per eseguirlo localmente.

Oltre agli LLM, Alibaba ha rilasciato un aggiornamento significativo del suo modello di linguaggio di visione con l'introduzione di Qwen2-VL. Qwen2-VL è in grado di comprendere video di oltre 20 minuti e supporta le risposte a domande basate su video.

È stato progettato per essere integrato in telefoni cellulari, automobili e robot per consentire l'automazione di operazioni che richiedono una comprensione visiva.

Alibaba ha anche presentato un nuovo modello text-to-video come parte del suo generatore di immagini, la grande famiglia di modelli Tongyi Wanxiang. Tongyi Wanxiang AI Video è in grado di produrre contenuti video di qualità cinematografica e animazioni 3D con vari stili artistici sulla base di suggerimenti testuali.

Le demo sembrano impressionanti e lo strumento è gratuito, anche se è necessario un numero di cellulare cinese per poterlo utilizzare. iscriviti qui. Sora avrà una seria concorrenza quando, o se, OpenAI lo rilascerà.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Eugene van der Watt

Eugene proviene da un background di ingegneria elettronica e ama tutto ciò che è tecnologico. Quando si prende una pausa dal consumo di notizie sull'intelligenza artificiale, lo si può trovare al tavolo da biliardo.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni