Anthropic presenta su nuevo gran modelo lingüístico (LLM), Claude 2

11 de julio de 2023

Claude AI

Anthropic, una empresa de IA fundada por antiguos ejecutivos de OpenAI, ha presentado su nuevo modelo de lenguaje de gran tamaño (LLM), Claude 2. 

Disponible como beta web en EE.UU. y el Reino Unido y a través de una API de pago, el nuevo modelo presume de un mayor rendimiento y capacidad en comparación con su predecesor. 

Claude 2 es una evolución de Claude 1.3, capaz de buscar documentos, resumir contenidos, escribir, codificar y responder preguntas. Es similar a otros LLM como ChatGPT, pero acepta archivos adjuntos, lo que permite a los usuarios subir archivos y que la IA los analice y utilice.

Claude 2 supera a 1.3 en varios aspectos. Por ejemplo, obtiene mejores puntuaciones en varias pruebas, como el examen de abogacía y las preguntas de opción múltiple del US Medical Licensing Exam. También supera a su predecesor en problemas matemáticos y de codificación, incluida la prueba de codificación Codex Human Level Python. 

Sandy Banerjee, responsable de salida al mercado de Anthropic, explica estas mejoras: "Hemos trabajado para mejorar el razonamiento y la autoconciencia del modelo, para que sea más consciente de "así es como sigo las instrucciones", "soy capaz de procesar instrucciones de varios pasos" y también más consciente de sus limitaciones".

Los datos de entrenamiento de Claude 2, recopilados a partir de sitios web, conjuntos de datos con licencia de terceros y datos de usuarios de principios de 2023, son más recientes que los de Claude 1.3. Sin embargo, los modelos son similares en última instancia. Sin embargo, los modelos son similares en última instancia: Banerjee admite que Claude 2 es una versión optimizada de Claude 1.3.

Al igual que otros LLM, Claude dista mucho de ser infalible. TechCrunch dice la IA ha sido manipulada para inventar nombres de sustancias químicas inexistentes y ofrecer instrucciones cuestionables para producir uranio apto para armamento, entre otras cosas. Sin embargo, Antrópico afirma que Claude 2 es "2 veces mejor" a la hora de proporcionar respuestas "inofensivas" que su predecesor. 

Banerjee declaró: "[Nuestra] evaluación interna de red teaming puntúa nuestros modelos en un conjunto muy amplio y representativo de indicaciones adversas dañinas", "y lo hacemos con una combinación de pruebas automatizadas y comprobaciones manuales". Esto es importante para Anthropic, ya que la personalidad neutral del modelo es fundamental para los esfuerzos de marketing de la empresa. 

Anthropic utiliza una técnica específica denominada 'IA constitucionalque dota a modelos como Claude 2 de valores específicos definidos por una "constitución". El objetivo es que el comportamiento del modelo sea más fácil de entender y ajustar según sea necesario.

La visión de Anthropic es crear un "algoritmo de última generación para el autoaprendizaje de la IA", y Claude 2 es sólo un paso hacia este objetivo. 

Banerjee concluyó: "Todavía estamos trabajando en nuestro enfoque". "Tenemos que asegurarnos, mientras lo hacemos, de que el modelo acabe siendo tan inofensivo y útil como la iteración anterior".

¿Qué es Claude?

Claude es un asistente de inteligencia artificial desarrollado por Anthropic, una startup respaldada por Google e integrada por algunos ex investigadores de OpenAI. Está diseñado para ser "útil, honesto e inofensivo" y es accesible a través de una interfaz de chat y una API.

Claude puede ayudar con una amplia gama de tareas, como la síntesis, la redacción creativa y colaborativa, la respuesta a preguntas y la codificación.

Varias empresas han implantado Claude, entre ellas Notion, Quora y DuckDuckGo. Se ha utilizado para mejorar la aplicación de chat con IA de Quora, Poe, y se integra en la aplicación de productividad Notion.

Otros socios son Robin AI, una empresa jurídica que utiliza Claude para comprender y redactar textos jurídicos complejos, y AssemblyAI, que utiliza Claude para transcribir y comprender datos de audio a escala.

La capacidad de Claude para trabajar con archivos es potencialmente más adecuada para algunos usos basados en la productividad en comparación con competidores como ChatGPT.

Los usuarios de EE.UU. y el Reino Unido pueden juzgarlo por sí mismos probando la beta web.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales