Claude.ai es la respuesta de Anthropic a ChatGPT y el modelo de IA que lo sustenta acaba de recibir una importante actualización.
Claude 2.1 ofrece una mejora significativa del rendimiento en comparación con Claude 2.0. Probablemente la mayor mejora sea la duplicación de su ventana contextual, pero también hay otras características impresionantes.
Antrópicos entrada del blog entra en muchos más detalles, pero he aquí un resumen simplificado de las mejoras.
Ventana de contexto
La ventana de contexto de un modelo determina cuántos tokens puede guardar en su memoria. Claude 2.1 tiene ahora una ventana de contexto de 200.000 fichas, el doble que Claude 2.0 y la mayor del sector. Para comparar, GPT-4 Turbo tiene una ventana de contexto de 128k.
Esto significa que podrías soltar unas 150.000 palabras, o 500 páginas, en un chat con Claude y hacerle preguntas relacionadas con el material. Bueno, en teoría.
Greg Kamradt hizo una prueba de resistencia de la capacidad de recuperación de Claude 2.1 y comprobó que tenía problemas de precisión cuando el contexto se hacía más largo y cuando el hecho a recuperar se situaba en algún punto intermedio del documento.
Claude 2.1 (200.000 fichas) - Pruebas de presión para la recuperación de contextos largos
A todos nos gusta aumentar la longitud del contexto, pero ¿cómo es el rendimiento?
Anthropic me ha ofrecido acceso anticipado a Claude 2.1, así que he repetido el análisis de "la aguja en el pajar" que hice en GPT-4.
Esto es lo que he encontrado:... pic.twitter.com/B36KnjtJmE
- Greg Kamradt (@GregKamradt) 21 de noviembre de 2023
Sigue siendo bastante impresionante a pesar de algunos problemas de precisión en el recuerdo.
Más precisión y honestidad
Claude 2.1 comete menos errores y te mentirá con menos frecuencia. Es 30% más probable que dé una respuesta correcta que antes.
Al igual que otros modelos de IA, seguirá alucinando, pero lo hace aproximadamente la mitad que Claude 2.0.
Claude 2.1 también ha mejorado su humildad intelectual. También es casi el doble de probable que se niegue a responder a una pregunta cuando no sabe la respuesta en lugar de inventarse algo.
Uso de la herramienta API
Claude puede ahora interactuar con las bases de datos de un usuario, buscar una respuesta en los recursos web o interactuar con otras herramientas a través de las API.
Según Anthropic, ahora un usuario puede definir un conjunto de herramientas, formular una pregunta y, a continuación, Claude decidirá qué herramientas utilizar para responder a la pregunta.
Claude ya se integra con Zapier, por lo que esta capacidad añadida de traducir el lenguaje natural en API o llamadas a funciones podría ser enorme. Podríamos ver pronto la versión de Anthropic de las GPT de OpenAI?
La función de uso de herramientas está en fase beta, así que tendremos que esperar para ver de qué es capaz.
Indicaciones del sistema
Esta función permite que una llamada a la API proporcione a Claude contexto e instrucciones sobre cómo responder antes de que se introduzca una solicitud humana.
Esto significa que puedes hacer que Claude asuma un determinado personaje o voz y decirle cosas que debe o no debe hacer al interactuar con el usuario. Las siguientes interacciones con Claude harán que las respuestas del chat se mantengan en el personaje durante más tiempo.
Si quieres experimentar Claude 2.1 puedes dirigirte a la interfaz de chat en claude.ai. La ventana contextual de 200k sólo está disponible para Claude Pro usuarios.