Anthropic apresenta o seu novo modelo de língua de grande dimensão (LLM), Claude 2

11 de julho de 2023

Claude AI

A Anthropic, uma empresa de IA fundada por ex-executivos da OpenAI, apresentou o seu novo modelo de linguagem de grande dimensão (LLM), Claude 2. 

Disponível como uma versão beta na Web nos EUA e no Reino Unido e através de uma API paga, o novo modelo apresenta um desempenho e uma capacidade melhorados em comparação com o seu antecessor. 

O Claude 2 é uma evolução do Claude 1.3, capaz de pesquisar documentos, resumir conteúdos, escrever, codificar e responder a perguntas. É semelhante a outros LLMs como o ChatGPT, mas aceita anexos, permitindo aos utilizadores carregar ficheiros e fazer com que a IA os analise e utilize.

O Claude 2 supera o 1.3 em várias áreas. Por exemplo, tem uma pontuação mais elevada em vários testes, incluindo o exame da ordem dos advogados e as perguntas de escolha múltipla do exame de licenciamento médico dos EUA. Também supera o seu antecessor em problemas de matemática e codificação, incluindo o teste de codificação Python do Codex Human Level. 

Sandy Banerjee, diretor de entrada no mercado da Anthropic, explica estas melhorias: "Temos estado a trabalhar para melhorar o raciocínio e a espécie de auto-consciência do modelo, para que esteja mais consciente de que "gosto de seguir instruções", "sou capaz de processar instruções em várias etapas" e também mais consciente das suas limitações".

Os dados de treino do Claude 2, compilados a partir de websites, conjuntos de dados licenciados de terceiros e dados de utilizadores do início de 2023, são mais recentes do que os do Claude 1.3. No entanto, os modelos são, em última análise, semelhantes - Banerjee admite que o Claude 2 é uma versão optimizada do Claude 1.3.

Tal como outros LLM, o Claude está longe de ser infalível. TechCrunch diz a IA foi manipulada para inventar nomes para produtos químicos inexistentes e oferecer instruções questionáveis para a produção de urânio para armas, entre outras coisas. No entanto, Antrópica afirma que o Claude 2 é "duas vezes melhor" a dar respostas "inofensivas" do que o seu antecessor. 

Banerjee declarou: "A nossa avaliação interna de equipa vermelha classifica os nossos modelos num conjunto representativo muito grande de avisos adversários prejudiciais", "e fazemo-lo com uma combinação de testes automatizados e verificações manuais". Isso é importante para a Anthropic, pois a personalidade neutra do modelo é fundamental para os esforços de marketing da empresa. 

O Anthropic utiliza uma técnica específica chamada 'IA constitucionalO objetivo é tornar o comportamento do modelo mais fácil de compreender e ajustar conforme necessário. O objetivo é tornar o comportamento do modelo mais fácil de compreender e ajustar conforme necessário.

A visão da Anthropic é criar um "algoritmo de próxima geração para o auto-ensino da IA", e o Claude 2 é apenas um passo em direção a este objetivo. 

Banerjee concluiu: "Ainda estamos a trabalhar na nossa abordagem". "Precisamos de ter a certeza, à medida que o fazemos, que o modelo acaba por ser tão inofensivo e útil como a iteração anterior."

O que é o Claude?

O Claude é um assistente de IA desenvolvido pela Anthropic, uma empresa apoiada pela Google e constituída por alguns antigos investigadores da OpenAI. Foi concebido para ser "útil, honesto e inofensivo" e está acessível através de uma interface de conversação e de uma API.

O Claude pode ajudar numa vasta gama de tarefas, incluindo resumos, escrita criativa e colaborativa, resposta a perguntas e codificação.

Várias empresas implementaram o Claude, incluindo a Notion, a Quora e a DuckDuckGo. Foi utilizado para melhorar a aplicação de chat com IA do Quora, Poe, e está integrado na aplicação de produtividade Notion.

Outros parceiros incluem a Robin AI, uma empresa do sector jurídico que utiliza o Claude para compreender e redigir textos jurídicos complexos, e a AssemblyAI, que utiliza o Claude para transcrever e compreender dados áudio em grande escala.

A capacidade do Claude para trabalhar com ficheiros é potencialmente mais adequada para algumas utilizações baseadas na produtividade, em comparação com concorrentes como o ChatGPT.

Os utilizadores dos Estados Unidos e do Reino Unido podem avaliar isso mesmo experimentando a versão beta da Web.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições