Anthropic lança o Claude Sonnet 3.5 que bate o GPT-4o

24 de junho de 2024

  • A Anthropic lançou o Claude Sonnet 3.5, que é agora o seu modelo mais potente, superando o Claude 3 Opus
  • O Claude Sonnet 3.5 oferece capacidades de visão e codificação melhoradas e uma janela de pré-visualização de artefactos
  • O Claude Sonnet 3.5 bate o GPT-4o e o Gemini 1.5 Pro em vários testes de referência MMLU

A Anthropic lançou o Claude Sonnet 3.5, que é mais potente, mais rápido e mais barato do que o seu modelo maior Claude 3 Opus.

Quando o Anthropic lançou o seu Claude 3 famílias de modelos em marçoA partir de então, foram introduzidas três variantes, Haiku, Sonnet e Opus, cada uma com um aumento de tamanho, capacidade e custo de fichas.

O Claude Sonnet 3.5 é significativamente mais inteligente do que o seu antecessor maior e vem com uma grande atualização nas suas capacidades de processamento e codificação de visão.

É também muito mais rápido e mais barato. O Anthropic diz que a inferência com Claude Sonnet 3.5 é duas vezes mais rápida do que com Claude Opus 3, 5 vezes mais barata por token, e também tem uma janela de contexto de 200k.

Em apenas 3 meses, o Claude Opus 3 tornou-se redundante e o Anthropic diz que podemos esperar versões 3.5 actualizadas do Haiku e do Opus "em breve".

A Anthropic disponibilizou o modelo para utilização gratuita na sua Claude.ai interface de conversação e aplicação iOS. A subscrição de uma conta paga dá-lhe limites de taxa mais elevados e acesso à API.

Resultados do teste de referência do Claude Sonnet 3.5

O Claude Sonnet 3.5 não consegue pesquisar na Internet nem gerar imagens, mas as suas capacidades melhoradas de processamento de visão, matemática, raciocínio e codificação venceram os líderes da indústria GPT-4o e Gemini Pro 1.5 numa série de testes de referência.

Comparação de benchmark do Claude Sonnet 3.5. Fonte: Antrópico
Comparação de benchmark do Claude Sonnet 3.5. Fonte: Antrópico

As pontuações de raciocínio visual matemático e de codificação são os números que se destacam aqui e são as capacidades de codificação melhoradas que deixaram os utilizadores particularmente entusiasmados.

Artefactos

A funcionalidade Artefactos é uma adição interessante à interface de chat web do Claude. O ChatGPT irá gerar código para si, mas depois terá de o copiar e colar num ambiente de desenvolvimento para o experimentar.

O Claude tem agora uma janela adicional que se abre junto à interface de conversação, onde pode ver uma pré-visualização em tempo real do código. As edições são imediatamente reflectidas na janela Artefactos.

A Anthropic diz que os Artefactos irão em breve suportar equipas e permitir o trabalho colaborativo em projectos. Esperemos que o ChatGPT tenha a sua própria versão do Artifacts em breve.

A Anthropic afirmou que submeteu o Claude 3.5 Sonnet a rigorosos testes de segurança e que o entregou também ao Instituto de Segurança da Inteligência Artificial do Reino Unido (UK AISI) para avaliação da segurança antes da sua utilização.

A sua avaliação interna de segurança, publicado na ficha-modeloA Comissão Europeia, através do seu relatório sobre a segurança da IA, classificou o "Claude 3.5 Sonnet como um modelo de nível de segurança de IA 2 (ASL-2), indicando que não representa um risco de danos catastróficos".

A Anthropic afirma que, para além das versões actualizadas dos modelos Haiku e Opus, irá adicionar em breve modalidades, capacidade de memória e mais funcionalidades de integração empresarial.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Eugene van der Watt

Eugene vem de uma formação em engenharia eletrónica e adora tudo o que é tecnologia. Quando faz uma pausa no consumo de notícias sobre IA, pode encontrá-lo à mesa de snooker.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições