Anthropic publie Claude Sonnet 3.5 qui bat GPT-4o

24 juin 2024

  • Anthropic a publié Claude Sonnet 3.5 qui est maintenant son modèle le plus puissant, battant Claude 3 Opus.
  • Claude Sonnet 3.5 offre une vision améliorée et des capacités de codage, ainsi qu'une fenêtre de prévisualisation des artefacts.
  • Claude Sonnet 3.5 bat GPT-4o et Gemini 1.5 Pro sur plusieurs tests de référence MMLU

Anthropic a lancé Claude Sonnet 3.5 qui est plus puissant, plus rapide et moins cher que son modèle plus grand Claude 3 Opus.

Lorsque Anthropic a publié son Claude 3 familles de modèles en marsIls se déclinaient en trois variantes, Haiku, Sonnet et Opus, chacune augmentant en taille, en capacité et en coût des jetons.

Claude Sonnet 3.5 est nettement plus intelligent que son prédécesseur et bénéficie d'une amélioration considérable de ses capacités de traitement de la vision et de codage.

Il est également beaucoup plus rapide et moins cher. Anthropic affirme que l'inférence avec Claude Sonnet 3.5 est deux fois plus rapide que Claude Opus 3, 5 fois moins chère par jeton, et qu'elle dispose également d'une fenêtre contextuelle de 200k.

En l'espace de 3 mois, Claude Opus 3 est devenu redondant et Anthropic annonce que nous pouvons nous attendre à des versions 3.5 améliorées de Haiku et d'Opus "bientôt".

Anthropic a mis le modèle à disposition gratuitement sur son site web. Claude.ai et l'application iOS. En souscrivant à un compte payant, vous bénéficiez de limites tarifaires plus élevées et d'un accès à l'API.

Résultats des tests de Claude Sonnet 3.5

Claude Sonnet 3.5 ne peut pas faire de recherches sur Internet ou générer des images, mais ses capacités améliorées de traitement de la vision, de mathématiques, de raisonnement et de codage ont battu les leaders de l'industrie GPT-4o et Gemini Pro 1.5 sur une série de critères de référence.

Comparaison des performances de Claude Sonnet 3.5. Source : Anthropic
Comparaison des performances de Claude Sonnet 3.5. Source : Anthropic

Les scores de raisonnement mathématique visuel et de codage sont les chiffres les plus marquants et ce sont les compétences de codage améliorées qui ont particulièrement enthousiasmé les utilisateurs.

Artefacts

La fonction Artifacts est un ajout intéressant à l'interface de discussion en ligne de Claude. ChatGPT génère du code pour vous, mais vous devez ensuite le copier et le coller dans un environnement de développement pour le tester.

Claude dispose désormais d'une fenêtre supplémentaire qui s'ouvre à côté de l'interface de discussion et dans laquelle vous pouvez voir un aperçu du code en temps réel. Les modifications sont immédiatement répercutées dans la fenêtre Artifacts.

Anthropic indique qu'Artifacts supportera bientôt les équipes et permettra le travail collaboratif sur les projets. Espérons que ChatGPT aura bientôt sa propre version d'Artifacts.

Anthropic a déclaré avoir soumis Claude 3.5 Sonnet à des tests de sécurité rigoureux et l'avoir également confié à l'Institut britannique de sécurité de l'intelligence artificielle (UK AISI) pour une évaluation de la sécurité avant déploiement.

Son évaluation interne de la sécurité, publié dans la carte modèleLa Commission européenne a classé "Claude 3.5 Sonnet comme un modèle d'IA de niveau de sécurité 2 (ASL-2), indiquant qu'il ne présente pas de risque de dommages catastrophiques".

Anthropic indique qu'en plus des versions améliorées des modèles Haiku et Opus, elle ajoutera bientôt des modalités, des capacités de mémoire et d'autres fonctions d'intégration à l'entreprise.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Eugène van der Watt

Eugene a une formation d'ingénieur en électronique et adore tout ce qui touche à la technologie. Lorsqu'il fait une pause dans sa consommation d'informations sur l'IA, vous le trouverez à la table de snooker.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation