MosaicML представляет семейство моделей ИИ с открытым исходным кодом MPT-30B

24 июня 2023 года

Открытый источник

Компания MosaicML представила свои новые модели ИИ с открытым исходным кодом - MPT-30B Base, Instruct и Chat. 

Являясь частью серии MPT (MosaicML Pre Trained Transformer), эти модели с открытым исходным кодом считаются самыми совершенными в своей категории, превосходя GPT-3 по большинству ключевых показателей. 

Мозаика подготовили свои новые модели на базе новейших чипов NVIDIA H100, выпущенных в начале этого года. 

MPT-30B - это первый публично известный LLM, обученный на высокопроизводительных графических процессорах NVIDIA H100. 

С момента своего появления 5 мая 2023 года предыдущие модели MPT-7B (Base, Instruct, Chat, StoryWriter) Mosaic были загружены более 3,3 миллиона раз. MPT-30B имеет 30 миллиардов параметров - гораздо меньше, чем 175 миллиардов параметров GPT-3 или предполагаемый 1 триллион параметров GPT-4. 

Но количество параметров - это еще не все. MPT-30B обучался на более длинных последовательностях, включающих до 8 000 лексем, что в 4 раза больше, чем у GPT-3, семейства моделей LLaMA и модели Falcon.

Это позволяет MPT-30B лучше управлять корпоративными рабочими процессами с большим объемом данных и превосходить другие модели для рабочих процессов с большим объемом кода.

Несколько компаний, таких как Replit, ведущая веб-инструментальная среда разработки, и Scatter Lab, стартап в области искусственного интеллекта, уже воспользовались моделями MPT с открытым исходным кодом, которые являются более настраиваемыми, чем проприетарные модели, такие как GPT-3. 

Илан Твиг, соучредитель и технический директор компании Navan, сказал. "В Navan мы используем генеративный ИИ во всех наших продуктах и услугах, обеспечивая работу таких сервисов, как виртуальный туристический агент и разговорный агент бизнес-аналитики. Фундаментальные модели MosaicML предлагают самые современные языковые возможности, но при этом чрезвычайно эффективны для тонкой настройки и масштабного обслуживания выводов". 

MPT-30B, теперь доступен через HuggingFace HubОн полностью открыт, и разработчики могут дорабатывать его с учетом своих данных. 

Mosaic стремится дать предприятиям возможность интегрировать мощные модели с открытым исходным кодом в свой рабочий процесс, сохраняя при этом суверенитет данных. 

Преимущество открытого исходного кода

Модели с открытым исходным кодом быстрое преодоление разрыва с такими конкурентами, как OpenAI. 

Поскольку вычислительные ресурсы, необходимые для обучения и развертывания моделей, снижаются, разработчикам с открытым исходным кодом больше не нужны многомиллионные суперкомпьютеры с сотнями высокопроизводительных процессоров для обучения своих моделей. 

То же самое касается и развертывания моделей - MPT-30B может работать на одном GPU, а сообщество разработчиков с открытым исходным кодом даже смогло запустить уменьшенную версию модели LLaMa на Raspberry PI.

Кроме того, модели с открытым исходным кодом дают стратегические преимущества бизнес-пользователям.

Например, предприятия таких отраслей, как здравоохранение и банковское дело, могут предпочесть не делиться своими данными с OpenAI или Google. 

Навин Рао, соучредитель и генеральный директор MosaicML, считает проекты с открытым исходным кодом своими союзниками, заявляя, что они "закрывают брешь в этих моделях с закрытым исходным кодом". Хотя он признает превосходство GPT-4 от OpenAI, он утверждает, что модели с открытым исходным кодом "перешагнули порог, за которым эти модели действительно становятся чрезвычайно полезными".

ИИ с открытым исходным кодом развивается стремительно, что заставляет некоторых обвинять крупные технологические компании в том, что они пытаются сдержать его рост. Предприятия уже создают свои собственные стеки ИИ с открытым исходным кодом, экономя деньги, которые в противном случае могли бы пойти на финансирование таких компаний, как OpenAI. 

A Утечка служебной записки от сотрудника Google говорит, что все крупные технологические разработчики ИИ - Google, Microsoft, Anthropic и OpenAI - конкурируют с разработчиками с открытым исходным кодом. 

Разработчики ИИ с открытым исходным кодом могут создавать и итерировать модели быстрее, чем крупные технологи, что позволяет им опережать основные модели ИИ.

Это не лишено опасностей, поскольку модели с открытым исходным кодом сложно контролировать и регулировать, когда они переходят в руки общественности.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения