Anthropic lança o Claude Sonnet 3.5 que bate o GPT-4o

A Anthropic lançou o Claude Sonnet 3.5, que é mais potente, mais rápido e mais barato do que o seu modelo maior Claude 3 Opus.

Quando o Anthropic lançou o seu Claude 3 famílias de modelos em marçoA partir de então, foram introduzidas três variantes, Haiku, Sonnet e Opus, cada uma com um aumento de tamanho, capacidade e custo de fichas.

O Claude Sonnet 3.5 é significativamente mais inteligente do que o seu antecessor maior e vem com uma grande atualização nas suas capacidades de processamento e codificação de visão.

É também muito mais rápido e mais barato. O Anthropic diz que a inferência com Claude Sonnet 3.5 é duas vezes mais rápida do que com Claude Opus 3, 5 vezes mais barata por token, e também tem uma janela de contexto de 200k.

Em apenas 3 meses, o Claude Opus 3 tornou-se redundante e o Anthropic diz que podemos esperar versões 3.5 actualizadas do Haiku e do Opus "em breve".

A Anthropic disponibilizou o modelo para utilização gratuita na sua Claude.ai interface de conversação e aplicação iOS. A subscrição de uma conta paga dá-lhe limites de taxa mais elevados e acesso à API.

Resultados do teste de referência do Claude Sonnet 3.5

O Claude Sonnet 3.5 não consegue pesquisar na Internet nem gerar imagens, mas as suas capacidades melhoradas de processamento de visão, matemática, raciocínio e codificação venceram os líderes da indústria GPT-4o e Gemini Pro 1.5 numa série de testes de referência.

Comparação de benchmark do Claude Sonnet 3.5. Fonte: Antrópico

As pontuações de raciocínio visual matemático e de codificação são os números que se destacam aqui e são as capacidades de codificação melhoradas que deixaram os utilizadores particularmente entusiasmados.

Estou muito impressionado com Claude 3.5 Competências de codificação do Soneto.

Fiz esta visualização do caos com 40 pêndulos triplos, cada um com condições iniciais ligeiramente diferentes, em cerca de 5 minutos após um par de iterações! Teria facilmente demorado horas a fazer isto sem o claude. pic.twitter.com/RhCKhFwUyu

- Luis Batalha 🇵🇹🇺🇸 (@luismbat) 22 de junho de 2024

Artefactos

A funcionalidade Artefactos é uma adição interessante à interface de chat web do Claude. O ChatGPT irá gerar código para si, mas depois terá de o copiar e colar num ambiente de desenvolvimento para o experimentar.

O Claude tem agora uma janela adicional que se abre junto à interface de conversação, onde pode ver uma pré-visualização em tempo real do código. As edições são imediatamente reflectidas na janela Artefactos.

A Anthropic diz que os Artefactos irão em breve suportar equipas e permitir o trabalho colaborativo em projectos. Esperemos que o ChatGPT tenha a sua própria versão do Artifacts em breve.

A Anthropic afirmou que submeteu o Claude 3.5 Sonnet a rigorosos testes de segurança e que o entregou também ao Instituto de Segurança da Inteligência Artificial do Reino Unido (UK AISI) para avaliação da segurança antes da sua utilização.

A sua avaliação interna de segurança, publicado na ficha-modeloA Comissão Europeia, através do seu relatório sobre a segurança da IA, classificou o "Claude 3.5 Sonnet como um modelo de nível de segurança de IA 2 (ASL-2), indicando que não representa um risco de danos catastróficos".

A Anthropic afirma que, para além das versões actualizadas dos modelos Haiku e Opus, irá adicionar em breve modalidades, capacidade de memória e mais funcionalidades de integração empresarial.

Anthropic lança o Claude Sonnet 3.5 que bate o GPT-4o

Resultados do teste de referência do Claude Sonnet 3.5

Artefactos

Junte-se ao futuro

Eugene van der Watt

ARTIGOS RELACIONADOS

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Anthropic lança o Claude Sonnet 3.5 que bate o GPT-4o

Resultados do teste de referência do Claude Sonnet 3.5

Artefactos

Junte-se ao futuro

Eugene van der Watt

ARTIGOS RELACIONADOS

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

PDF GRATUITO EXCLUSIVOFique à frente com o DailyAI

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI