Anthropic släpper Claude Sonnet 3.5 som slår GPT-4o

24 juni 2024

  • Anthropic släppte Claude Sonnet 3.5 som nu är dess mest kraftfulla modell och slår Claude 3 Opus
  • Claude Sonnet 3.5 erbjuder uppgraderade syn- och kodningsförmågor och ett förhandsgranskningsfönster för artefakter
  • Claude Sonnet 3.5 slår GPT-4o och Gemini 1.5 Pro i flera MMLU-benchmarktester

Anthropic släppte Claude Sonnet 3.5 som är kraftfullare, snabbare och billigare än den större modellen Claude 3 Opus.

När Anthropic släppte sitt Claude 3 modellfamiljer i marskom de i tre varianter, Haiku, Sonnet och Opus, som alla ökade i storlek, kapacitet och symboliska kostnader.

Claude Sonnet 3.5 är betydligt intelligentare än sin större föregångare och har en stor uppgradering av sin kapacitet för bildbehandling och kodning.

Det är också mycket snabbare och billigare också. Anthropic säger att inferens med Claude Sonnet 3.5 är dubbelt så snabb som Claude Opus 3, 5 gånger billigare per token och dessutom har ett kontextfönster på 200 000.

Inom bara tre månader har Claude Opus 3 blivit överflödig och Anthropic säger att vi kan förvänta oss uppgraderade 3.5-versioner av Haiku och Opus "snart".

Anthropic har gjort modellen tillgänglig för gratis användning på sin Claude.ai chattgränssnitt och iOS-app. Om du registrerar dig för ett betalt konto får du högre hastighetsgränser och API-åtkomst.

Claude Sonnet 3.5 benchmark-resultat

Claude Sonnet 3.5 kan inte söka på internet eller generera bilder, men dess uppgraderade förmåga att bearbeta synintryck, räkna, resonera och koda slår branschledarna GPT-4o och Gemini Pro 1.5 på en rad olika benchmarks.

Claude Sonnet 3.5 jämförelse av riktmärken. Källa: Anthropic Antropisk
Claude Sonnet 3.5 jämförelse av riktmärken. Källa: Anthropic Antropisk

Resultaten för visuellt matematiskt resonemang och kodning är de siffror som sticker ut här och det är de förbättrade kodningsfärdigheterna som har gjort användarna särskilt glada.

Artefakter

Funktionen Artifacts är ett spännande tillskott till Claudes webbchattgränssnitt. ChatGPT genererar kod åt dig, men sedan måste du kopiera och klistra in den i en utvecklingsmiljö för att prova den.

Claude har nu ett extra fönster som öppnas bredvid chattgränssnittet där du kan se en förhandsgranskning av koden i realtid. Ändringar återspeglas omedelbart i fönstret Artifacts.

Anthropic säger att Artifacts snart kommer att stödja team och möjliggöra samarbete i projekt. Låt oss hoppas att ChatGPT får sin egen version av Artifacts snart.

Anthropic sade sig ha låtit Claude 3.5 Sonnet genomgå rigorösa säkerhetstester och även gett den till Storbritanniens Artificial Intelligence Safety Institute (UK AISI) för en säkerhetsutvärdering före driftsättning.

Dess interna säkerhetsutvärdering, publicerad i modellkortetklassificerade "Claude 3.5 Sonnet som en ASL-2-modell (AI Safety Level 2), vilket indikerar att den inte utgör någon risk för katastrofal skada."

Förutom uppgraderade versioner av Haiku- och Opus-modellerna kommer Anthropic inom kort att lägga till modaliteter, minneskapacitet och fler funktioner för integrering med företag.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar