A Google, a OpenAI e a Mistral lançaram novas versões dos seus modelos de IA de ponta em apenas 12 horas.
A Meta também se vai juntar à festa com o seu modelo Llama 3, e o muito aguardado GPT-5 da OpenAI está na calha.
O que começou por ser uma categoria de nicho dominada pelo ChatGPT está agora inundada de alternativas que transcendem a Big Tech e a divisão entre código aberto e fechado.
Google Gemini Pro 1.5
O Gemini Pro 1.5 da Google foi a primeira novidade, introduzindo avanços na compreensão de contextos longos que desafiam o Claude 3 Opus, que detém os ases nessa categoria.
O nosso modelo de IA de última geração Gemini 1.5 Pro está agora disponível em pré-visualização pública em @GoogleCloud's #VertexAI plataforma.
A sua janela de contexto longo já está a ajudar as empresas a analisar grandes quantidades de dados, a criar agentes de serviço ao cliente alimentados por IA e muito mais. → https://t.co/CLMN3wNmeP pic.twitter.com/RpRVUul3eg
- Google DeepMind (@GoogleDeepMind) 9 de abril de 2024
Com a capacidade de processar até 1 milhão de tokens, o Gemini Pro 1.5 pode lidar com grandes quantidades de informações simultaneamente, incluindo 700.000 palavras, uma hora de vídeo ou 11 horas de áudio.
A sua arquitetura Mixture-of-Experts (MoE) aumenta a eficiência e o desempenho através da utilização de modelos especializados para tarefas específicas.
A lista de modelos Gemini da Google é bastante complexa, mas este é o modelo mais capaz para tarefas típicas.
A Google também está a permitir que os programadores façam 50 pedidos gratuitos à API diariamente, o que, segundo uma pessoa no X, custaria até $1.400.
Atualmente, o Gemini 1.5 Pro está disponível em 180 países.
Nova versão do GPT-4 Turbo
A OpenAI lançou então uma nova versão, GPT-4 Turbo, com processamento matemático e visual superior.
De acordo com um post do X, "GPT-4 Turbo com Vision está agora disponível na API. Os pedidos Vision podem agora também utilizar o modo JSON e a chamada de funções".
O GPT-4 Turbo com Vision está agora disponível na API. Os pedidos Vision podem agora também utilizar o modo JSON e a chamada de funções.https://t.co/cbvJjij3uL
Abaixo estão algumas formas fantásticas de os programadores estarem a construir com visão. Deixe a sua resposta 🧵
- Programadores da OpenAI (@OpenAIDevs) 9 de abril de 2024
A OpenAI prevê lançar o GPT -5 em breve, bem como o seu modelo de texto para vídeo Sora, que não tem concorrentes notáveis neste momento (embora isso possa mudar).
Mixtral 8x22B
No entanto, talvez a maior surpresa tenha vindo de Mistralque corajosamente publicou o seu modelo Mixtral 8x22B como um ficheiro de 281GB que pode ser descarregado gratuitamente via torrent.
magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%https://t.co/2UepcMGLGd%3A1337%2Fannounce&tr=http%3A%2F%https://t.co/OdtBUsbeV5%3A1337%2Fannounce
- Mistral AI (@MistralAI) 10 de abril de 2024
Com uns impressionantes 176 mil milhões de parâmetros e um comprimento de contexto de 65 000 tokens, espera-se que este modelo de código aberto sobre a licença Apache 2.0 supere o anterior modelo Mixtral 8x7B da Mistral, que já tinha ultrapassado concorrentes como o Llama 2 70B em vários parâmetros de referência.
A arquitetura MoE avançada do Mixtral 8x22B permite uma computação eficiente e um desempenho melhorado em relação às iterações anteriores.
Meta Llama 3 está a chegar
Para não ficar para trás, os relatórios sugerem que a Meta poderá lançar uma versão pequena do seu modelo Llama 3 muito aguardado já na próxima semana, estando o modelo completo de código aberto ainda previsto para julho.
Prevê-se que o Llama 3 venha em vários tamanhos, desde modelos muito pequenos que competem com o Claude Haiku ou o Gemini Nano até modelos maiores, totalmente reactivos e com capacidade de raciocínio que rivalizam com o GPT-4 ou o Claude 3 Opus.
Multiplicação de modelos
Um ecossistema de IA generativa, outrora dominado pelo ChatGPT, está agora repleto de alternativas.
Praticamente todas as grandes empresas de tecnologia estão envolvidas, quer diretamente, quer através de investimentos consideráveis. E com cada jogador a juntar-se à luta, a esperança de que uma fação domine o mercado está a diminuir.
Estamos agora também a assistir à redução da distância entre os modelos de código fechado da OpenAI, Anthropic, Google, etc., e as alternativas de código fechado da Mistral, Meta e outros.
Os modelos de código aberto ainda são bastante inacessíveis à população em geral, mas é provável que isso também mude.
Então, será que algum destes modelos representa um verdadeiro progresso na aprendizagem automática, ou apenas mais do mesmo mas melhor? Depende de quem perguntar.
Alguns, como Elon Musk, prevêem que a IA irá ultrapassar a inteligência humana no prazo de um ano.
Outros, como o cientista-chefe da Meta Yann LeCun, argumentam que a IA está a quilómetros de distância de nós em relação a qualquer medida robusta de inteligência.
LeCun explicado em fevereiro sobre os actuais LLMs: "Basicamente, não podem inventar coisas novas. Vão regurgitar aproximadamente tudo aquilo em que foram formados a partir de dados públicos, o que significa que podem ser obtidos no Google. As pessoas têm dito: "Meu Deus, temos de regulamentar os LLM porque eles vão ser muito perigosos". Isso não é verdade".
A Meta pretende criar uma IA "orientada para objectos" que compreenda mais verdadeiramente o mundo e tente planear e raciocinar em torno dele.
"Estamos a trabalhar arduamente para descobrir como fazer com que estes modelos não falem apenas, mas raciocinem, planeiem..... ter memória," explicou Joelle Pineauvice-presidente de investigação de IA da Meta.
O diretor de operações da OpenAI, Brad Lightcap, também disse que a sua empresa está a concentrar-se em melhorar a capacidade da IA para raciocinar e lidar com tarefas mais complexas.
"Vamos começar a ver a IA capaz de realizar tarefas mais complexas de uma forma mais sofisticada", disse ele num evento recente. "Penso que, com o tempo... vamos ver os modelos a avançar para tarefas mais longas e mais complexas, o que implicitamente requer a melhoria da sua capacidade de raciocínio."
À medida que 2024 se aproxima do verão, a comunidade da IA e a sociedade em geral estarão atentas para ver que desenvolvimentos inovadores emergem dos laboratórios destes gigantes da tecnologia.
Vai ser uma seleção bastante colorida até ao final do ano.