Qwen 2.5 от Alibaba - лучшая модель с открытым исходным кодом в области математики и кодирования

Alibaba выпустила более 100 моделей ИИ с открытым исходным кодом, включая Qwen 2.5 72B, которая превосходит другие модели с открытым исходным кодом в математических и кодовых тестах.

Значительная часть внимания индустрии ИИ в области моделей с открытым исходным кодом была прикована к усилиям Meta с Llama 3, но Qwen 2.5 от Alibaba значительно сократил разрыв. Только что выпущенное семейство моделей Qwen 2.5 имеет размер от 0,5 до 72 миллиардов параметров с обобщенными базовыми моделями, а также моделями, ориентированными на решение очень специфических задач.

Alibaba утверждает, что эти модели обладают "расширенными знаниями и более сильными возможностями в области математики и кодирования", а специализированные модели ориентированы на кодирование, математику и различные модальности, включая язык, аудио и зрение.

Alibaba Cloud также объявила об обновлении своей собственной флагманской модели Qwen-Max, которую она не выпустила в виде открытого исходного кода. Бенчмарки Qwen 2.5 Max выглядят неплохо, но именно модель Qwen 2.5 72B вызвала наибольший ажиотаж среди поклонников открытого кода.

Qwen 2.5 72B обучает моделированию математики и кодированию. Источник: Alibaba Cloud

По результатам бенчмарков Qwen 2.5 72B опережает гораздо более крупный флагман Meta. Ллама 3.1 405B модели по нескольким направлениям, особенно в математике и кодировании. Разрыв между моделями с открытым исходным кодом и проприетарными моделями, такими как OpenAI и Google, также быстро сокращается.

Первые пользователи Qwen 2.5 72B говорят о том, что эта модель не только не уступает Sonnet 3.5, но даже опережает его. OpenAIмодели o1 в кодировании.

Qwen 2.5 с открытым исходным кодом выигрывает у моделей o1 по кодированию 🤯🤯🤯

Qwen 2.5 показывает более высокие результаты, чем модели o1, по кодированию на Livebench AI

Qwen находится чуть ниже Sonnet 3.5, и для режима с открытым исходным кодом это просто потрясающе!!!

o1 хорошо справляется с некоторыми сложными задачами, но ужасен в проблемах завершения кода и... pic.twitter.com/iazam61eP9

- Бинду Редди (@bindureddy) 20 сентября 2024 года

Alibaba утверждает, что все новые модели были обучены на масштабном наборе данных, включающем до 18 триллионов токенов. Модели Qwen 2.5 имеют контекстное окно объемом до 128 тыс. и могут генерировать результаты объемом до 8 тыс. токенов.

Переход к более компактным, функциональным и бесплатным моделям с открытым исходным кодом, вероятно, окажет большее влияние на многих пользователей, чем более продвинутые модели, такие как o1. Возможности этих моделей на границе и на устройстве означают, что вы можете получить много пользы от бесплатной модели, работающей на вашем ноутбуке.

Младшая модель Qwen 2.5 обеспечивает кодирование уровня GPT-4 за меньшую цену или даже бесплатно, если у вас есть достойный ноутбук для локального запуска.

У нас дома есть GPT-4 для кодирования! Я посмотрела OpenAI?ref_src=twsrc%5Etfw”>@OpenAI Результаты GPT-4 0613 для различных бенчмарков и их сравнение с @Alibaba_Qwen 2.5 7B кодер. 👀

> Спустя 15 месяцев после выхода GPT-0613 мы имеем открытый LLM под Apache 2.0, который работает так же хорошо. 🤯

> Ценообразование на GPT-4... pic.twitter.com/2szw5kwTe5

- Филипп Шмид (@_philschmid) 22 сентября 2024 года

Помимо LLM, Alibaba выпустила значительное обновление своей языковой модели видения, представив Qwen2-VL. Qwen2-VL может воспринимать видео продолжительностью более 20 минут и поддерживает ответы на вопросы на основе видео.

Он предназначен для интеграции в мобильные телефоны, автомобили и роботов, чтобы обеспечить автоматизацию операций, требующих визуального понимания.

Alibaba также представила новую модель преобразования текста в видео в рамках своего генератора изображений, семейства больших моделей Tongyi Wanxiang. Tongyi Wanxiang AI Video может создавать видеоконтент кинематографического качества и 3D-анимацию с различными художественными стилями на основе текстовых подсказок.

Демо-версии выглядят впечатляюще, а пользоваться инструментом можно бесплатно, хотя для этого вам понадобится китайский номер мобильного телефона. подпишитесь на него здесь. У Sora будет серьезная конкуренция, когда или если OpenAI в конце концов выпустит ее.

Qwen 2.5 от Alibaba - лучшая модель с открытым исходным кодом в области математики и кодирования

Присоединяйтесь к будущему

Юджин ван дер Ватт

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Qwen 2.5 от Alibaba - лучшая модель с открытым исходным кодом в области математики и кодирования

Присоединяйтесь к будущему

Юджин ван дер Ватт

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDFБудьте впереди с DailyAI

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI