По сообщениям, Microsoft создает 500-байтную LLM под названием MAI-1

Согласно отчету The Information, Microsoft работает над LLM с параметрами 500B под названием MAI-1, который сможет противостоять GPT-4 и Google. Gemini модели.

Недавно мы сообщали о том, что компания Microsoft Фи-3 Мини семейство небольших языковых моделей с количеством параметров от 3,8 до 14 ББ. MAI-1 с 500 ББ параметров станет самой большой моделью, развернутой Microsoft.

По своим размерам он находится в одном ряду с GPT-4 и более крупным проектом Google. Gemini модели. По слухам, GPT-4 имеет 1,76 Т параметров, но это модель Mixture of Experts (MoE), поэтому при выводе данных задействуется только около 280 Б параметров.

Об архитектуре MAI-1 нет никакой информации, но если это плотная модель, в отличие от MoE, то она будет довольно мощной. Ожидается, что модель Llama 3 от Meta будет иметь 400B параметров.

Разработкой MAI-1 руководит Мустафа Сулейман, соучредитель и бывший руководитель отдела прикладного искусственного интеллекта в компании DeepMind.

Мустафа ушел DeepMind чтобы стать соучредителем ИИ-стартапа Inflection в 2022 году. В марте этого года Microsoft наняла большую часть сотрудников Inflection и заплатила $650 миллионов за права на интеллектуальную собственность компании.

MAI-1, судя по всему, является совершенно новым проектом Microsoft, а не продолжением существующего проекта Inflection. О дате выхода пока ничего не известно, но мы можем увидеть предварительную версию MAI-1 16 мая на конференции разработчиков Microsoft Build.

Microsoft OpenAIкрупнейший инвестор, поэтому тот факт, что она разрабатывает свои собственные программы LLM, чтобы конкурировать с программами OpenAI некоторых немного удивляет. Может быть, Microsoft хеджирует свои ставки, придерживается нескольких стратегий развития или чего-то другого?

Технический директор Microsoft Кевин Скотт попытался преуменьшить значение этого вопроса. В своем сообщении на LinkedIn Скотт сказал: "Я не уверен, почему это новость, но просто подытожу очевидное: мы создаем большие суперкомпьютеры для обучения моделей ИИ; наш партнер Open AI использует эти суперкомпьютеры для обучения моделей, определяющих границы; а затем мы оба делаем эти модели доступными в продуктах и сервисах, чтобы многие люди могли ими воспользоваться. Нам очень нравится такая схема".

Возможно, Скотт искренен в этом заявлении, но когда MAI-1 будет выпущен, он может поставить Microsoft в жесткую конкуренцию с компанией, в которую она вложила миллиарды долларов.

Будет ли MAI-1 выпущен как раз в то время, когда OpenAI чтобы превзойти его, высвободив GPT-5? OpenAI На этот четверг было запланировано мероприятие, на котором компания должна была рассказать об обновлениях и демонстрации продуктов, но с тех пор мероприятие было отложено.

С Загадочные чатботы GPT-2 Появляясь, исчезая и снова появляясь, Microsoft строит огромные модели и OpenAI Не давая нам угадать, драма ИИ не прекращается.

По сообщениям, Microsoft создает 500-байтную LLM под названием MAI-1

Присоединяйтесь к будущему

Юджин ван дер Ватт

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

По сообщениям, Microsoft создает 500-байтную LLM под названием MAI-1

Присоединяйтесь к будущему

Юджин ван дер Ватт

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDFБудьте впереди с DailyAI

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI