Na corrida global à IA, um adversário improvável surgiu para enfrentar os grandes titãs da tecnologia com a sua visão radical de modelos linguísticos de código aberto.
Operando sob o radar durante grande parte de 2022, a startup francesa de oito meses Mistral AI revelou na semana passada um software inovador de geração de texto que se equipara aos principais sistemas proprietários da Meta e da OpenAI.
Fundada por ex-funcionários da Google e do Facebook, a Mistral entrou em cena em maio com uma ronda de financiamento de $120 milhões, avaliando-a em $250 milhões antes do lançamento. A empresa prometeu seguir um caminho divergente no desenvolvimento da IA, centrado na transparência, na colaboração académica e na partilha pública de códigos, em vez da abordagem de código fechado dos seus pares de Silicon Valley.
Nesse sentido, estão muito mais alinhados com o Meta do que os programadores "fechados" como a OpenAI, embora excedam o Meta na "abertura" das suas abordagens de investigação.
No início, muitos especialistas do sector não acreditaram nas hipóteses da Mistral face aos orçamentos de investigação de milhares de milhões de dólares dos gigantes tecnológicos norte-americanos apoiados por empresas como a Amazon, a Google e a Microsoft. Mas uma torrente de demonstrações que mostravam as rápidas inovações da empresa sediada em Paris começou a mudar as percepções.
A sua mais recente criação, um modelo de IA com 8 mil milhões de parâmetros, denominado MixtralA solução de inteligência artificial da OpenAI, a OpenAI, demonstra criatividade, raciocínio e senso comum a par do modelo LLaMA da Meta e, em alguns casos, ultrapassa o estimado GPT-3.5 da OpenAI. Ler mais sobre a Mixtral aqui.
A velocidade do Mixtral 8x7b (Q5_0.gguf) no M2 é INSANA
Ainda estou a descobrir como fazer escrita criativa com ele, mas é honestamente alucinante para um modelo bruto com capacidades GPT 3.5. https://t.co/BkrqsxuFHu pic.twitter.com/D1oQIaSP53
- Denis Shiryaev 💙💛 (@literallydenis) 11 de dezembro de 2023
De acordo com as referências, o Mixtral iguala ou excede esses sistemas em testes padronizados de tradução, compreensão de leitura e outras métricas de inteligência generativa.
A Mistral ganhou respeito pela sua abordagem informal e prática dos lançamentos de IA em comparação com a Google, que foi recentemente criticada pela sua falsa demo Geminie a OpenAI, que tem sido criticada pelas suas comunicações, por vezes sacarinas, nas redes sociais após o lançamento de produtos.
Como anunciam os seus novos modelos de LLM:
Mistral AI Vs Resto deles 😅 pic.twitter.com/sawXdEunL6
- Ramsri Goutham Golla (@ramsri_goutham) 10 de dezembro de 2023
Então, como é que um novato furtivo superou alguns dos nomes mais valiosos do mundo da IA com uma fração dos seus recursos?
Os observadores atribuem o mérito à metodologia de formação inovadora da Mistral, que utiliza conjuntos de dados mais pequenos e uma codificação eficiente. Enquanto a Meta e a OpenAI ainda protegem as suas abordagens, a Mistral publica os seus modelos publicamente para serem examinados e melhorados gratuitamente pela comunidade ao abrigo de licenças de código aberto.
A ascensão meteórica da Mistral é evidente - a empresa conquistou $450 milhões em novos financiamentos com uma avaliação de $2 mil milhões - astronómica para uma empresa de tecnologia da UE e promissora para a incursão do bloco da região na IA generativa. Os actuais apoiantes incluem a Andreessen Horowitz, o BNP Paribas e a Salesforce.
Com o Mixtral amplamente considerado o modelo linguístico de código aberto mais poderoso atualmente existente, os utilizadores estão a aumentar e ganharam muitos seguidores entre a comunidade de investigação por abraçarem a verdadeira essência do código aberto.
A este respeito, o diretor executivo da Mistral, Arthur Mensch, eliminou alguns termos e condições da política de utilizador da Mistral que proibiam as pessoas de utilizar os seus modelos para treinar ou melhorar outros modelos ou competir com eles, ilustrando a abordagem de fonte aberta da empresa.
Removido, divirta-se! https://t.co/jbSJ87YvZf
- Arthur Mensch (@arthurmensch) 12 de dezembro de 2023
Irá a Lei da IA da UE prejudicar a Mistral e outras empresas europeias de IA?
Mas poderá a Lei da IA da UE impedir o crescimento da Mistral e de outros criadores europeus de IA, como a Aleph Alpha da Alemanha?
Desde o acordo político sobre a Lei da IA na semana passadaO Presidente Emmanuel Macron manifestou dúvidas sobre a legislação, alertando para o facto de as regras poderem colocar as empresas tecnológicas europeias em desvantagem em relação a rivais menos regulamentadas noutros países.
No seu discurso em Toulouse, Macron citou especificamente os regulamentos relativos aos modelos fundamentais - os principais sistemas de IA subjacentes a chatbots como o ChatGPT, que podem gerar resmas de texto semelhante ao humano. O Comissário argumenta que as duras restrições propostas no Lei da IA pode prejudicar a competitividade dos líderes europeus em matéria de IA.
Macron apontou a Mistral, uma empresa parisiense em rápido crescimento, como um exemplo do "génio francês" na inovação da IA e manifestou a preocupação de que os regulamentos possam inibir esses actores emergentes.
O grupo industrial DigitalEurope fez eco das preocupações de que os extensos requisitos de conformidade poderiam desviar recursos da investigação e desenvolvimento, colocando as empresas europeias atrás das principais potências de IA. No início do ano, 150 empresas europeias advertidas no início do ano sobre o impacto da lei na inovação.
Embora a Presidente da Comissão Europeia, Ursula von der Leyen, tenha elogiado o ato por codificar os valores europeus, continuam a ser possíveis alterações à medida que os Estados-Membros analisam os regulamentos antes da ratificação final.
Como sempre, as empresas de IA enfrentam obstáculos regulamentares para poderem continuar o seu ritmo de crescimento.