Anthropic brengt Claude Sonnet 3.5 uit die GPT-4o verslaat

24 juni 2024

  • Anthropic heeft Claude Sonnet 3.5 uitgebracht, wat nu het krachtigste model is en Claude 3 Opus verslaat.
  • Claude Sonnet 3.5 biedt verbeterde vision- en codeermogelijkheden en een voorbeeldvenster voor artefacten
  • Claude Sonnet 3.5 verslaat GPT-4o en Gemini 1.5 Pro in meerdere MMLU-benchmarktests

Anthropic heeft Claude Sonnet 3.5 uitgebracht, die krachtiger, sneller en goedkoper is dan het grotere Claude 3 Opus model.

Toen Anthropic zijn Claude 3 modellenfamilie in maartZe waren verkrijgbaar in drie varianten: Haiku, Sonnet en Opus, elk met een grotere omvang, meer mogelijkheden en hogere kosten.

Claude Sonnet 3.5 is aanzienlijk intelligenter dan zijn grotere voorganger en wordt geleverd met een grote upgrade in de beeldverwerking en coderingsmogelijkheden.

Het is ook een stuk sneller en goedkoper. Anthropic zegt dat inferentie met Claude Sonnet 3.5 twee keer zo snel is als Claude Opus 3, 5 keer goedkoper per token, en ook een contextvenster van 200k heeft.

Binnen slechts 3 maanden is Claude Opus 3 overbodig geworden en Anthropic zegt dat we "binnenkort" verbeterde 3.5 versies van Haiku en Opus kunnen verwachten.

Anthropic heeft het model gratis beschikbaar gesteld voor gebruik op zijn Claude.ai chatinterface en iOS-app. Als je je aanmeldt voor een betaalde account, krijg je hogere tarieflimieten en API-toegang.

Claude Sonnet 3.5 benchmarkresultaten

Claude Sonnet 3.5 kan niet zoeken op het internet of afbeeldingen genereren, maar de verbeterde visieverwerking, wiskunde, redeneer- en codeervaardigheden verslaan de industrieleiders GPT-4o en Gemini Pro 1.5 in een reeks benchmarks.

Claude Sonnet 3.5 benchmark vergelijking. Bron: Antropisch
Claude Sonnet 3.5 benchmark vergelijking. Bron: Antropisch

De scores voor visueel wiskundig redeneren en coderen zijn de opvallende cijfers hier en het zijn vooral de verbeterde coderingsvaardigheden die gebruikers enthousiast hebben gemaakt.

Artefacten

De functie Artifacts is een spannende toevoeging aan de webchatinterface van Claude. ChatGPT genereert code voor je, maar dan moet je die kopiëren en plakken in een ontwikkelomgeving om hem uit te proberen.

Claude heeft nu een extra venster dat opent naast de chat-interface waar je een real-time preview van de code kunt zien. Bewerkingen worden onmiddellijk weergegeven in het venster Artifacts.

Anthropic zegt dat Artifacts binnenkort teams zal ondersteunen en het mogelijk zal maken om samen aan projecten te werken. Laten we hopen dat ChatGPT snel zijn eigen versie van Artifacts krijgt.

Anthropic zegt dat het Claude 3.5 Sonnet heeft onderworpen aan rigoureuze veiligheidstests en het ook aan het Britse Artificial Intelligence Safety Institute (UK AISI) heeft gegeven voor een veiligheidsevaluatie voorafgaand aan de inzet.

De interne veiligheidsevaluatie, gepubliceerd in de modelkaartclassificeerde "Claude 3.5 Sonnet als een AI Safety Level 2 (ASL-2) model, wat aangeeft dat het geen risico op catastrofale schade met zich meebrengt".

Anthropic zegt dat het, naast verbeterde versies van de Haiku en Opus modellen, binnenkort modaliteiten, geheugencapaciteit en meer functies voor bedrijfsintegratie zal toevoegen.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden