A Meta lançou a muito aguardada série Llama 3, com os dois primeiros modelos, Llama 3-8B e Llama 3-70B, agora amplamente disponíveis.
Há dias, numa evento em LondresOs executivos da Meta, Nick Clegg e Yann LeCun, disseram que Llama 3 estava iminente este mês.
As duas primeiras versões foram lançadas hoje, marcando o terceiro e quarto grandes modelos abertos a serem lançados este mês após Grok-1.5V da xAI e 8x22B do Mistral.
Lhama 3 é pré-treinado com um impressionante número de 15 triliões de tokens, um aumento de 7 vezes em comparação com o Llama 2. Os dados de pré-treinamento também incluem quatro vezes mais código.
Por baixo do capô, o Llama 3 introduz melhorias na arquitetura, como um tokenizador mais eficiente com um vocabulário maior de 128K tokens.
Eis um breve resumo do desempenho da Llama 3:
Desempenho do Llama 3 8B:
- Supera modelos como o 7B da Mistral e o Gemma 7B da Google em vários parâmetros de referência.
- Excelente em MMLU, ARC, DROP, GPQA (principalmente perguntas de carácter científico), HumanEval (geração de código), GSM-8K (problemas de matemática), MATH (teste de referência de matemática), AGIEval (resolução de problemas) e BIG-Bench Hard (raciocínio de senso comum).
Comparação do 70B com outros modelos:
- O Llama 3 70B é competitivo com modelos de IA de topo como o Gemini 1.5 Pro da Google.
- Beats Gemini 1.5 Pro em MMLU, HumanEval e GSM-8K.
- Apresenta um desempenho melhor do que o Claude 3 Sonnet da Anthropic (o nível intermédio da sua série Claude 3) em cinco testes de referência: MMLU, GPQA, HumanEval, GSM-8K e MATH.
Estas são excelentes pontuações para um modelo aberto (embora a licença do Meta tenha algumas limitações).
Isto faz com que o Llama 3 seja o novo modelo gratuito de código aberto com melhor desempenho (mais ou menos).
A Llama 3 também será mais agradável e menos teimosa de utilizar - menos não respostas e maior precisão para perguntas triviais, factos históricos e questões relacionadas com STEM.
A Llama 3 está pronta para se tornar amplamente disponível nas principais plataformas, incluindo serviços de nuvem e fornecedores de API.
A Meta já está a trabalhar para expandir o Llama 3 para 400 mil milhões de parâmetros e acrescentar novas funções como a multimodalidade, o suporte multilingue e a compreensão contextual alargada.
O papel desonesto do Meta na IA generativa
Em muitos aspectos, o Meta surgiu como o rebelde da indústria da IA generativa.
O cientista-chefe de IA da Meta, Yann LeCun, uma das figuras mais respeitadas da IA, tem o que alguns consideram ser opiniões divergentes sobre a direção da IA - opiniões que criticam os projectos de código fechado dos concorrentes da Meta no domínio das grandes tecnologias.
Entretanto, o ex-Vice-Primeiro-Ministro britânico Nick Clegg, responsável pelos Assuntos Globais, foi criticado por algumas opiniões, por vezes laissez-faire, sobre os produtos de IA da Meta, o que poderá não surpreender nenhum britânico.
Na semana passada, Clegg pareceu minimizar o impacto da IA nas eleições e na manipulação de deep fakes. Um ponto de vista que contraria a narrativa predominante de que as deep fakes podem ser (ou já são) profundamente destrutivas.
De facto, o Conselho de Supervisão do Meta é investigando ativamente dois casos de pornografia falsa profunda neste momento. O Conselho de Administração considerou que as acções de moderação de conteúdos do Meta eram demasiado lentas.
A Meta também se tem mostrado otimista quanto à melhoria da qualidade dos seus modelos. Joelle Pineau, vice-presidente de investigação de IA da Meta, afirmou: "Em muitos aspectos, os modelos que temos atualmente vão ser uma brincadeira de crianças quando comparados com os modelos que vão surgir daqui a cinco anos."
Se continuarmos a aumentar a generalidade e o poder do nosso modelo sem o socializar adequadamente, vamos ter um grande problema em mãos", advertiu Pineau.
O lançamento do Llama 3 ocorre no momento em que os agentes de IA da Meta no Facebook causam uma grande agitação nas redes sociais.
Num grupo do Facebook para pais da cidade de Nova Iorque, um assistente Meta AI - concebido para dar conselhos e responder a perguntas - pessoas chocadas alegando ter um "filho sobredotado e deficiente" a frequentar uma escola específica para "sobredotados e talentosos".
Quando confrontada pelos membros do grupo, a IA admitiu: "Sou apenas um grande modelo de linguagem, não tenho experiências pessoais nem filhos", naquilo que alguns classificaram como um incidente ao estilo de Black Mirror.
Os modelos Llama 3, Grok-1.5 e Mistral transferem mais poder para as comunidades de código aberto, diluindo ainda mais o mercado da IA generativa.
Mas isso pode ser uma coisa boa, uma vez que agora é a sobrevivência do mais forte, e a bola está firmemente no campo da Microsoft-OpenAI, que se espera que dê o próximo passo neste fascinante jogo de xadrez da gen-AI.