Alibaba выпустила более 100 моделей ИИ с открытым исходным кодом, включая Qwen 2.5 72B, которая превосходит другие модели с открытым исходным кодом в математических и кодовых тестах.
Значительная часть внимания индустрии ИИ в области моделей с открытым исходным кодом была прикована к усилиям Meta с Llama 3, но Qwen 2.5 от Alibaba значительно сократил разрыв. Только что выпущенное семейство моделей Qwen 2.5 имеет размер от 0,5 до 72 миллиардов параметров с обобщенными базовыми моделями, а также моделями, ориентированными на решение очень специфических задач.
Alibaba утверждает, что эти модели обладают "расширенными знаниями и более сильными возможностями в области математики и кодирования", а специализированные модели ориентированы на кодирование, математику и различные модальности, включая язык, аудио и зрение.
Alibaba Cloud также объявила об обновлении своей собственной флагманской модели Qwen-Max, которую она не выпустила в виде открытого исходного кода. Бенчмарки Qwen 2.5 Max выглядят неплохо, но именно модель Qwen 2.5 72B вызвала наибольший ажиотаж среди поклонников открытого кода.
По результатам бенчмарков Qwen 2.5 72B опережает гораздо более крупный флагман Meta. Ллама 3.1 405B модели по нескольким направлениям, особенно в математике и кодировании. Разрыв между моделями с открытым исходным кодом и проприетарными моделями, такими как OpenAI и Google, также быстро сокращается.
Первые пользователи Qwen 2.5 72B говорят о том, что эта модель не только не уступает Sonnet 3.5, но даже опережает его. OpenAIмодели o1 в кодировании.
Qwen 2.5 с открытым исходным кодом выигрывает у моделей o1 по кодированию 🤯🤯🤯
Qwen 2.5 показывает более высокие результаты, чем модели o1, по кодированию на Livebench AI
Qwen находится чуть ниже Sonnet 3.5, и для режима с открытым исходным кодом это просто потрясающе!!!
o1 хорошо справляется с некоторыми сложными задачами, но ужасен в проблемах завершения кода и... pic.twitter.com/iazam61eP9
- Бинду Редди (@bindureddy) 20 сентября 2024 года
Alibaba утверждает, что все новые модели были обучены на масштабном наборе данных, включающем до 18 триллионов токенов. Модели Qwen 2.5 имеют контекстное окно объемом до 128 тыс. и могут генерировать результаты объемом до 8 тыс. токенов.
Переход к более компактным, функциональным и бесплатным моделям с открытым исходным кодом, вероятно, окажет большее влияние на многих пользователей, чем более продвинутые модели, такие как o1. Возможности этих моделей на границе и на устройстве означают, что вы можете получить много пользы от бесплатной модели, работающей на вашем ноутбуке.
Младшая модель Qwen 2.5 обеспечивает кодирование уровня GPT-4 за меньшую цену или даже бесплатно, если у вас есть достойный ноутбук для локального запуска.
У нас дома есть GPT-4 для кодирования! Я посмотрела OpenAI?ref_src=twsrc%5Etfw”>@OpenAI Результаты GPT-4 0613 для различных бенчмарков и их сравнение с @Alibaba_Qwen 2.5 7B кодер. 👀
> Спустя 15 месяцев после выхода GPT-0613 мы имеем открытый LLM под Apache 2.0, который работает так же хорошо. 🤯
> Ценообразование на GPT-4... pic.twitter.com/2szw5kwTe5
- Филипп Шмид (@_philschmid) 22 сентября 2024 года
Помимо LLM, Alibaba выпустила значительное обновление своей языковой модели видения, представив Qwen2-VL. Qwen2-VL может воспринимать видео продолжительностью более 20 минут и поддерживает ответы на вопросы на основе видео.
Он предназначен для интеграции в мобильные телефоны, автомобили и роботов, чтобы обеспечить автоматизацию операций, требующих визуального понимания.
Alibaba также представила новую модель преобразования текста в видео в рамках своего генератора изображений, семейства больших моделей Tongyi Wanxiang. Tongyi Wanxiang AI Video может создавать видеоконтент кинематографического качества и 3D-анимацию с различными художественными стилями на основе текстовых подсказок.
Демо-версии выглядят впечатляюще, а пользоваться инструментом можно бесплатно, хотя для этого вам понадобится китайский номер мобильного телефона. подпишитесь на него здесь. У Sora будет серьезная конкуренция, когда или если OpenAI в конце концов выпустит ее.