Alibaba выпускает LLM с открытым исходным кодом для борьбы с Llama 2 от Meta

7 августа 2023 года

Alibaba выпустила на своей платформе облачных вычислений две модели больших языков с открытым исходным кодом, которые, как ожидается, будут конкурировать с самой маленькой версией модели Llama 2 от Meta.

Китайская технологическая компания выпустила свою модель Tongyi Qiawen в начале этого года и утверждает, что новые релизы, Qwen-7B и Qwen-7B-Chat, являются урезанными версиями этой LLM. Слово "7B" в названиях моделей означает, что они были обучены на 7 миллиардах параметров, то есть на том же количестве, на котором была обучена самая маленькая версия Llama 2 от Meta.

Наличие предварительно обученных моделей - это огромная экономия времени и вычислительных затрат для компаний, которые хотят использовать модели ИИ в своих приложениях.

Компания Alibaba применяет аналогичный подход к Мета-версия Llama 2 сделав свои небольшие модели с открытым исходным кодом и свободными для внедрения сторонними разработчиками. Компания надеется, что это приведет к более широкому внедрению и реальному тестированию ее моделей.

Как и Meta, Alibaba называет модели "с открытым исходным кодом", хотя это не совсем так. Требования к использованию модели схожи с Llama 2: компаниям с числом пользователей 100 миллионов в месяц требуется лицензия от Alibaba.

Хотя модели доступны бесплатно для большинства пользователей, Alibaba получит финансовую выгоду, взимая плату с пользователей своей платформы облачных вычислений за их работу. Пока компания не планирует выпускать свою более крупную модель бесплатно или с открытым исходным кодом. Alibaba также производит Llama 2 доступны на ее серверах, поэтому будет интересно посмотреть, как пойдет процесс внедрения этих конкурирующих моделей.

Новости о выпуске появились примерно через 2 недели после того, как Alibaba объявила об обновлении своей платформы облачных вычислений.

Она обновила свой векторный движок на сервисе хранения данных AnalyticDB который, по словам компании, позволит значительно ускорить создание приложений для генеративного ИИ. Компания утверждает, что предварительно настроенные приложения ИИ можно создать всего за 30 минут.

Шаг Alibaba свидетельствует об усилении гонки ИИ между Китаем и США. Другие китайские технологические гиганты, Huawei и Tencent, также работают над собственными моделями, и вскоре ожидаются анонсы по этим направлениям.

Несмотря на неутолимый аппетит к применению ИИ, ограничения на экспорт микросхем из США и глобальный дефицит графических процессоров высокого класса несколько замедляют темпы развития китайского ИИ.

Сайт Китайские правила искусственного интеллекта которые вступят в силу на следующей неделе, также замедлят темпы работы разработчиков генеративного ИИ, поскольку они будут продираться через бюрократический процесс получения лицензий на ИИ от властей.

Китайские технологические компании, такие как Alibaba, надеются, что им удастся преодолеть некоторые из этих проблем, а также добиться большего распространения за пределами своего родного рынка. Это может оказаться гораздо проще, чем разработчикам платных моделей, таким как OpenAI и Google, найти применение в Китае.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения