Anthropic lanza Claude Sonnet 3.5, que supera a GPT-4o

24 de junio de 2024

  • Anthropic ha lanzado Claude Sonnet 3.5, que es ahora su modelo más potente, superando a Claude 3 Opus
  • Claude Sonnet 3.5 mejora la visión y la codificación, y ofrece una ventana de previsualización de artefactos.
  • Claude Sonnet 3.5 supera a GPT-4o y Gemini 1.5 Pro en múltiples pruebas comparativas MMLU

Anthropic ha lanzado Claude Sonnet 3.5, que es más potente, rápido y barato que su modelo Claude 3 Opus, de mayor tamaño.

Cuando Anthropic lanzó su Claude 3 familias de modelos en marzoEn el siglo XIX, se comercializaron en tres variantes: Haiku, Sonnet y Opus, cada una de las cuales aumentaba en tamaño, capacidad y coste de las fichas.

Claude Sonnet 3.5 es significativamente más inteligente que su predecesor de mayor tamaño y viene con una gran mejora en sus capacidades de procesamiento de visión y codificación.

También es mucho más rápido y barato. Anthropic dice que la inferencia con Claude Sonnet 3.5 es dos veces más rápida que con Claude Opus 3, 5 veces más barata por token, y además tiene una ventana de contexto de 200k.

En sólo 3 meses, Claude Opus 3 se ha quedado obsoleto y Anthropic dice que podemos esperar versiones actualizadas 3.5 de Haiku y Opus "en breve".

Anthropic ha puesto el modelo a disposición de los usuarios de forma gratuita en su sitio web. Claude.ai y la aplicación para iOS. Si contratas una cuenta de pago, obtendrás límites de tarifa más altos y acceso a la API.

Resultados de la prueba comparativa Claude Sonnet 3.5

Claude Sonnet 3.5 no puede buscar en Internet ni generar imágenes, pero sus capacidades mejoradas de procesamiento de visión, matemáticas, razonamiento y codificación superan a las de los líderes del sector GPT-4o y Gemini Pro 1.5 en una serie de pruebas comparativas.

Comparación de puntos de referencia de Claude Sonnet 3.5. Fuente: Anthropic
Comparación de puntos de referencia de Claude Sonnet 3.5. Fuente: Anthropic

El razonamiento matemático visual y las puntuaciones de codificación son las cifras más destacadas aquí y es la mejora de las habilidades de codificación lo que ha entusiasmado especialmente a los usuarios.

Artefactos

La función Artifacts es una interesante adición a la interfaz de chat web de Claude. ChatGPT generará el código por ti, pero luego tendrás que copiarlo y pegarlo en un entorno de desarrollo para probarlo.

Claude dispone ahora de una ventana adicional que se abre junto a la interfaz de chat en la que se puede ver una vista previa del código en tiempo real. Las ediciones se reflejan inmediatamente en la ventana de artefactos.

Anthropic dice que Artifacts pronto soportará equipos y permitirá el trabajo colaborativo en proyectos. Esperemos que ChatGPT tenga pronto su propia versión de Artifacts.

Anthropic afirma que sometió a Claude 3.5 Sonnet a rigurosas pruebas de seguridad y también lo entregó al Instituto de Seguridad de la Inteligencia Artificial del Reino Unido (UK AISI) para que evaluara su seguridad antes del despliegue.

Su evaluación interna de seguridad, publicado en la ficha modelo, clasificó "Claude 3.5 Sonnet como un modelo AI Safety Level 2 (ASL-2), lo que indica que no plantea riesgo de daños catastróficos".

Anthropic afirma que, además de las versiones mejoradas de los modelos Haiku y Opus, pronto añadirá modalidades, capacidad de memoria y más funciones de integración empresarial.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Eugene van der Watt

Eugene es ingeniero electrónico y le encanta todo lo relacionado con la tecnología. Cuando descansa de consumir noticias sobre IA, lo encontrará jugando al billar.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales