Три модели искусственного интеллекта выпущены в течение 24 часов, за ними последует Llama 3 от Meta

10 апреля 2024 года
  • Google, OpenAI и Mistral выпустили модели за несколько часов
  • Llama 3 от Meta и GPT-5 от OpenAI появятся в этом году
  • Модели ИИ распространяются как в открытом, так и в закрытом виде
Модели искусственного интеллекта

Компании Google, OpenAI и Mistral выпустили новые версии своих передовых моделей искусственного интеллекта всего за 12 часов. 

Компания Meta также собирается присоединиться к вечеринке со своей грядущей моделью Llama 3, а долгожданный GPT-5 от OpenAI находится в процессе разработки. 

То, что начиналось как нишевая категория, в которой доминировал ChatGPT, теперь наводнено альтернативами, выходящими за рамки Big Tech и разделения на открытый и закрытый исходный код.

Google Gemini Pro 1.5

Gemini Pro 1.5 от Google произвел первый фурор, представив достижения в понимании длинного контекста, которые бросили вызов Claude 3 Opus, в руках которого тузы в этой категории. 

Gemini Pro 1.5 может обрабатывать до 1 миллиона лексем одновременно, включая 700 000 слов, час видео или 11 часов аудио. 

Архитектура Mixture-of-Experts (MoE) повышает эффективность и производительность за счет использования специализированных моделей для решения конкретных задач.

Список моделей Gemini от Google довольно сложен, но эта модель считается самой способной для выполнения типичных задач. 

Google также позволяет разработчикам делать 50 бесплатных запросов к API в день, что, по оценкам одного из пользователей X, может стоить до $1 400.

В настоящее время Gemini 1.5 Pro доступен в 180 странах.

Новая версия GPT-4 Turbo

Затем OpenAI выпустила новую версию, GPT-4 Turbo, с улучшенной математикой и обработкой зрения. 

Согласно сообщению X, "GPT-4 Turbo с функцией Vision теперь широко доступен в API. Запросы Vision теперь также могут использовать режим JSON и вызов функций". 

В скором времени OpenAI планирует выпустить GPT -5, а также свою модель преобразования текста в видео Sora, у которой сейчас нет заметных конкурентов (хотя это может измениться). 

Микстраль 8x22B

Однако, пожалуй, самый большой сюрприз преподнесла Мистралькоторые смело опубликовали свою модель Mixtral 8x22B в виде свободно загружаемого файла размером 281 ГБ через торрент. 

Эта модель с открытым исходным кодом на лицензии Apache 2.0, имеющая впечатляющие 176 миллиардов параметров и длину контекста в 65 000 токенов, как ожидается, превзойдет предыдущую модель Mixtral 8x7B, которая уже превзошла таких конкурентов, как Llama 2 70B, в различных бенчмарках. 

Передовая архитектура MoE в Mixtral 8x22B обеспечивает эффективные вычисления и повышенную производительность по сравнению с предыдущими итерациями. 

Meta Llama 3 на подходе

Не оставаясь в стороне, компания Meta сообщает, что уже на следующей неделе может выпустить небольшую версию своей долгожданной модели Llama 3, а полноценная модель с открытым исходным кодом будет представлена в июле. 

Ожидается, что Llama 3 будет выпускаться в разных размерах, от очень маленьких моделей, конкурирующих с Claude Haiku или Gemini Nano, до более крупных, полностью отзывчивых и способных к рассуждениям моделей, конкурирующих с GPT-4 или Claude 3 Opus.

Умножение моделей

Экосистема генеративного ИИ, в которой когда-то доминировал ChatGPT, теперь наводнена альтернативами.

Практически каждая крупная технологическая компания участвует в этом процессе либо напрямую, либо через значительные инвестиции. И с каждым игроком, вступающим в борьбу, надежда на то, что одна фракция будет доминировать на рынке, уменьшается. 

Сейчас мы также видим, как сокращается разрыв между моделями с закрытым исходным кодом от OpenAI, Anthropic, Google и т. д. и альтернативами с закрытым исходным кодом от Mistral, Meta и других.

Модели с открытым исходным кодом пока еще малодоступны широким слоям населения, но и это, скорее всего, изменится. 

Так представляет ли какая-либо из этих моделей настоящий прогресс в машинном обучении или это просто то же самое, но лучше? Это зависит от того, кого вы спросите.

Некоторые, например Элон Маск, предсказывают, что ИИ превзойдет человеческий интеллект в течение года.

Другие, например, главный научный сотрудник компании Meta Янн ЛеКун утверждает, что ИИ значительно отстает от нас по любым надежным показателям интеллекта.

ЛеКун объяснил в феврале о нынешних магистрантах: "По сути, они не могут изобрести ничего нового. Они будут повторять примерно то, чему их учили, на основе общедоступных данных, а это значит, что вы можете найти их в Google. Люди говорят: "Боже мой, нам нужно регулировать деятельность LLM, потому что они будут очень опасны". Это просто неправда".

Цель Meta - создать "объектно-ориентированный" ИИ, который будет лучше понимать мир и пытаться планировать и рассуждать о нем. 

"Мы упорно работаем над тем, как заставить эти модели не просто говорить, а рассуждать, планировать.....иметь память". объяснила Жоэль Пиновице-президент по исследованиям в области искусственного интеллекта компании Meta.

Главный операционный директор OpenAI Брэд Лайткэп также сообщил, что его компания фокусируется на улучшении способности ИИ рассуждать и решать более сложные задачи. 

"Мы начнем видеть ИИ, способный решать более сложные задачи более сложным способом", - сказал он на недавнем мероприятии. "Я думаю, со временем... мы увидим, как модели переходят к более длительным и сложным задачам, а это неявно требует улучшения их способности рассуждать".

По мере приближения 2024 года сообщество ИИ и общество в целом будут внимательно следить за тем, какие революционные разработки появятся в лабораториях этих технологических гигантов. 

К концу года это будет довольно красочная подборка.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×
 
 

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI


 

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".



 
 

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения