Компании Google, OpenAI и Mistral выпустили новые версии своих передовых моделей искусственного интеллекта всего за 12 часов.
Компания Meta также собирается присоединиться к вечеринке со своей грядущей моделью Llama 3, а долгожданный GPT-5 от OpenAI находится в процессе разработки.
То, что начиналось как нишевая категория, в которой доминировал ChatGPT, теперь наводнено альтернативами, выходящими за рамки Big Tech и разделения на открытый и закрытый исходный код.
Google Gemini Pro 1.5
Gemini Pro 1.5 от Google произвел первый фурор, представив достижения в понимании длинного контекста, которые бросили вызов Claude 3 Opus, в руках которого тузы в этой категории.
Наша модель искусственного интеллекта нового поколения Gemini 1.5 Pro теперь доступна для предварительного публичного просмотра на @GoogleCloud's #VertexAI платформа.
Его длинное контекстное окно уже помогает компаниям анализировать большие объемы данных, создавать агентов по обслуживанию клиентов на базе ИИ и многое другое. → https://t.co/CLMN3wNmeP pic.twitter.com/RpRVUul3eg
- Google DeepMind (@GoogleDeepMind) 9 апреля 2024 года
Gemini Pro 1.5 может обрабатывать до 1 миллиона лексем одновременно, включая 700 000 слов, час видео или 11 часов аудио.
Архитектура Mixture-of-Experts (MoE) повышает эффективность и производительность за счет использования специализированных моделей для решения конкретных задач.
Список моделей Gemini от Google довольно сложен, но эта модель считается самой способной для выполнения типичных задач.
Google также позволяет разработчикам делать 50 бесплатных запросов к API в день, что, по оценкам одного из пользователей X, может стоить до $1 400.
В настоящее время Gemini 1.5 Pro доступен в 180 странах.
Новая версия GPT-4 Turbo
Затем OpenAI выпустила новую версию, GPT-4 Turbo, с улучшенной математикой и обработкой зрения.
Согласно сообщению X, "GPT-4 Turbo с функцией Vision теперь широко доступен в API. Запросы Vision теперь также могут использовать режим JSON и вызов функций".
GPT-4 Turbo с функцией Vision теперь широко доступен в API. Запросы Vision теперь также могут использовать режим JSON и вызов функций.https://t.co/cbvJjij3uL
Ниже приведены несколько отличных способов, с помощью которых разработчики создают свои продукты с учетом видения. Присылайте свои в ответ 🧵
- Разработчики OpenAI (@OpenAIDevs) 9 апреля 2024 года
В скором времени OpenAI планирует выпустить GPT -5, а также свою модель преобразования текста в видео Sora, у которой сейчас нет заметных конкурентов (хотя это может измениться).
Микстраль 8x22B
Однако, пожалуй, самый большой сюрприз преподнесла Мистралькоторые смело опубликовали свою модель Mixtral 8x22B в виде свободно загружаемого файла размером 281 ГБ через торрент.
magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%https://t.co/2UepcMGLGd%3A1337%2Fannounce&tr=http%3A%2F%https://t.co/OdtBUsbeV5%3A1337%2Fannounce
- Mistral AI (@MistralAI) 10 апреля 2024 года
Эта модель с открытым исходным кодом на лицензии Apache 2.0, имеющая впечатляющие 176 миллиардов параметров и длину контекста в 65 000 токенов, как ожидается, превзойдет предыдущую модель Mixtral 8x7B, которая уже превзошла таких конкурентов, как Llama 2 70B, в различных бенчмарках.
Передовая архитектура MoE в Mixtral 8x22B обеспечивает эффективные вычисления и повышенную производительность по сравнению с предыдущими итерациями.
Meta Llama 3 на подходе
Не оставаясь в стороне, компания Meta сообщает, что уже на следующей неделе может выпустить небольшую версию своей долгожданной модели Llama 3, а полноценная модель с открытым исходным кодом будет представлена в июле.
Ожидается, что Llama 3 будет выпускаться в разных размерах, от очень маленьких моделей, конкурирующих с Claude Haiku или Gemini Nano, до более крупных, полностью отзывчивых и способных к рассуждениям моделей, конкурирующих с GPT-4 или Claude 3 Opus.
Умножение моделей
Экосистема генеративного ИИ, в которой когда-то доминировал ChatGPT, теперь наводнена альтернативами.
Практически каждая крупная технологическая компания участвует в этом процессе либо напрямую, либо через значительные инвестиции. И с каждым игроком, вступающим в борьбу, надежда на то, что одна фракция будет доминировать на рынке, уменьшается.
Сейчас мы также видим, как сокращается разрыв между моделями с закрытым исходным кодом от OpenAI, Anthropic, Google и т. д. и альтернативами с закрытым исходным кодом от Mistral, Meta и других.
Модели с открытым исходным кодом пока еще малодоступны широким слоям населения, но и это, скорее всего, изменится.
Так представляет ли какая-либо из этих моделей настоящий прогресс в машинном обучении или это просто то же самое, но лучше? Это зависит от того, кого вы спросите.
Некоторые, например Элон Маск, предсказывают, что ИИ превзойдет человеческий интеллект в течение года.
Другие, например, главный научный сотрудник компании Meta Янн ЛеКун утверждает, что ИИ значительно отстает от нас по любым надежным показателям интеллекта.
ЛеКун объяснил в феврале о нынешних магистрантах: "По сути, они не могут изобрести ничего нового. Они будут повторять примерно то, чему их учили, на основе общедоступных данных, а это значит, что вы можете найти их в Google. Люди говорят: "Боже мой, нам нужно регулировать деятельность LLM, потому что они будут очень опасны". Это просто неправда".
Цель Meta - создать "объектно-ориентированный" ИИ, который будет лучше понимать мир и пытаться планировать и рассуждать о нем.
"Мы упорно работаем над тем, как заставить эти модели не просто говорить, а рассуждать, планировать.....иметь память". объяснила Жоэль Пиновице-президент по исследованиям в области искусственного интеллекта компании Meta.
Главный операционный директор OpenAI Брэд Лайткэп также сообщил, что его компания фокусируется на улучшении способности ИИ рассуждать и решать более сложные задачи.
"Мы начнем видеть ИИ, способный решать более сложные задачи более сложным способом", - сказал он на недавнем мероприятии. "Я думаю, со временем... мы увидим, как модели переходят к более длительным и сложным задачам, а это неявно требует улучшения их способности рассуждать".
По мере приближения 2024 года сообщество ИИ и общество в целом будут внимательно следить за тем, какие революционные разработки появятся в лабораториях этих технологических гигантов.
К концу года это будет довольно красочная подборка.