Qwen 2.5 от Alibaba - лучшая модель с открытым исходным кодом в области математики и кодирования

23 сентября 2024 года

  • Alibaba выпустила более 100 моделей с открытым исходным кодом из своего нового семейства Qwen 2.5
  • Qwen 72B побеждает Llama 3.1 405B в тестах на математику и кодирование
  • Alibaba представила новую модель преобразования текста в видео в рамках генератора изображений Tongyi Wanxiang.

Alibaba выпустила более 100 моделей ИИ с открытым исходным кодом, включая Qwen 2.5 72B, которая превосходит другие модели с открытым исходным кодом в математических и кодовых тестах.

Значительная часть внимания индустрии ИИ в области моделей с открытым исходным кодом была прикована к усилиям Meta с Llama 3, но Qwen 2.5 от Alibaba значительно сократил разрыв. Только что выпущенное семейство моделей Qwen 2.5 имеет размер от 0,5 до 72 миллиардов параметров с обобщенными базовыми моделями, а также моделями, ориентированными на решение очень специфических задач.

Alibaba утверждает, что эти модели обладают "расширенными знаниями и более сильными возможностями в области математики и кодирования", а специализированные модели ориентированы на кодирование, математику и различные модальности, включая язык, аудио и зрение.

Alibaba Cloud также объявила об обновлении своей собственной флагманской модели Qwen-Max, которую она не выпустила в виде открытого исходного кода. Бенчмарки Qwen 2.5 Max выглядят неплохо, но именно модель Qwen 2.5 72B вызвала наибольший ажиотаж среди поклонников открытого кода.

Qwen 2.5 72B обучает моделированию математики и кодированию. Источник: Alibaba Cloud

По результатам бенчмарков Qwen 2.5 72B опережает гораздо более крупный флагман Meta. Ллама 3.1 405B модели по нескольким направлениям, особенно в математике и кодировании. Разрыв между моделями с открытым исходным кодом и проприетарными моделями, такими как OpenAI и Google, также быстро сокращается.

Первые пользователи Qwen 2.5 72B говорят о том, что эта модель не только не уступает Sonnet 3.5, но даже опережает его. OpenAIмодели o1 в кодировании.

Alibaba утверждает, что все новые модели были обучены на масштабном наборе данных, включающем до 18 триллионов токенов. Модели Qwen 2.5 имеют контекстное окно объемом до 128 тыс. и могут генерировать результаты объемом до 8 тыс. токенов.

Переход к более компактным, функциональным и бесплатным моделям с открытым исходным кодом, вероятно, окажет большее влияние на многих пользователей, чем более продвинутые модели, такие как o1. Возможности этих моделей на границе и на устройстве означают, что вы можете получить много пользы от бесплатной модели, работающей на вашем ноутбуке.

Младшая модель Qwen 2.5 обеспечивает кодирование уровня GPT-4 за меньшую цену или даже бесплатно, если у вас есть достойный ноутбук для локального запуска.

Помимо LLM, Alibaba выпустила значительное обновление своей языковой модели видения, представив Qwen2-VL. Qwen2-VL может воспринимать видео продолжительностью более 20 минут и поддерживает ответы на вопросы на основе видео.

Он предназначен для интеграции в мобильные телефоны, автомобили и роботов, чтобы обеспечить автоматизацию операций, требующих визуального понимания.

Alibaba также представила новую модель преобразования текста в видео в рамках своего генератора изображений, семейства больших моделей Tongyi Wanxiang. Tongyi Wanxiang AI Video может создавать видеоконтент кинематографического качества и 3D-анимацию с различными художественными стилями на основе текстовых подсказок.

Демо-версии выглядят впечатляюще, а пользоваться инструментом можно бесплатно, хотя для этого вам понадобится китайский номер мобильного телефона. подпишитесь на него здесь. У Sora будет серьезная конкуренция, когда или если OpenAI в конце концов выпустит ее.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения