Anthropic släpper Claude Sonnet 3.5 som slår GPT-4o

Anthropic släppte Claude Sonnet 3.5 som är kraftfullare, snabbare och billigare än den större modellen Claude 3 Opus.

När Anthropic släppte sitt Claude 3 modellfamiljer i marskom de i tre varianter, Haiku, Sonnet och Opus, som alla ökade i storlek, kapacitet och symboliska kostnader.

Claude Sonnet 3.5 är betydligt intelligentare än sin större föregångare och har en stor uppgradering av sin kapacitet för bildbehandling och kodning.

Det är också mycket snabbare och billigare också. Anthropic säger att inferens med Claude Sonnet 3.5 är dubbelt så snabb som Claude Opus 3, 5 gånger billigare per token och dessutom har ett kontextfönster på 200 000.

Inom bara tre månader har Claude Opus 3 blivit överflödig och Anthropic säger att vi kan förvänta oss uppgraderade 3.5-versioner av Haiku och Opus "snart".

Anthropic har gjort modellen tillgänglig för gratis användning på sin Claude.ai chattgränssnitt och iOS-app. Om du registrerar dig för ett betalt konto får du högre hastighetsgränser och API-åtkomst.

Claude Sonnet 3.5 benchmark-resultat

Claude Sonnet 3.5 kan inte söka på internet eller generera bilder, men dess uppgraderade förmåga att bearbeta synintryck, räkna, resonera och koda slår branschledarna GPT-4o och Gemini Pro 1.5 på en rad olika benchmarks.

Claude Sonnet 3.5 jämförelse av riktmärken. Källa: Anthropic Antropisk

Resultaten för visuellt matematiskt resonemang och kodning är de siffror som sticker ut här och det är de förbättrade kodningsfärdigheterna som har gjort användarna särskilt glada.

Jag är verkligen imponerad av Claude 3.5 Sonnets kodningskunskaper.

Jag gjorde denna visualisering av kaos med 40 trippelpendlar, som alla har mycket lite olika initiala förhållanden, på ~ 5 minuter efter ett par iterationer! Det skulle lätt ha tagit mig timmar att göra detta utan claude. pic.twitter.com/RhCKhFwUyu

- Luis Batalha 🇵🇹🇺🇸 (@luismbat) 22 juni 2024

Artefakter

Funktionen Artifacts är ett spännande tillskott till Claudes webbchattgränssnitt. ChatGPT genererar kod åt dig, men sedan måste du kopiera och klistra in den i en utvecklingsmiljö för att prova den.

Claude har nu ett extra fönster som öppnas bredvid chattgränssnittet där du kan se en förhandsgranskning av koden i realtid. Ändringar återspeglas omedelbart i fönstret Artifacts.

Anthropic säger att Artifacts snart kommer att stödja team och möjliggöra samarbete i projekt. Låt oss hoppas att ChatGPT får sin egen version av Artifacts snart.

Anthropic sade sig ha låtit Claude 3.5 Sonnet genomgå rigorösa säkerhetstester och även gett den till Storbritanniens Artificial Intelligence Safety Institute (UK AISI) för en säkerhetsutvärdering före driftsättning.

Dess interna säkerhetsutvärdering, publicerad i modellkortetklassificerade "Claude 3.5 Sonnet som en ASL-2-modell (AI Safety Level 2), vilket indikerar att den inte utgör någon risk för katastrofal skada."

Förutom uppgraderade versioner av Haiku- och Opus-modellerna kommer Anthropic inom kort att lägga till modaliteter, minneskapacitet och fler funktioner för integrering med företag.

Anthropic släpper Claude Sonnet 3.5 som slår GPT-4o

Claude Sonnet 3.5 benchmark-resultat

Artefakter

Bli en del av framtiden

Eugene van der Watt

RELATERADE ARTIKLAR

Spelbranschen står inför en medelålderskris - är AI dess framtid?

OpenAI presenterar Realtime API och andra funktioner för utvecklare

Kaliforniens guvernör Gavin Newsom lägger in sitt veto mot SB 1047 Lagförslag om AI-säkerhet

Hur går det för Kina i AI-racet? Teknikjättar och nystartade företag tänjer på gränserna

Anthropic släpper Claude Sonnet 3.5 som slår GPT-4o

Claude Sonnet 3.5 benchmark-resultat

Artefakter

Bli en del av framtiden

Eugene van der Watt

RELATERADE ARTIKLAR

Spelbranschen står inför en medelålderskris - är AI dess framtid?

OpenAI presenterar Realtime API och andra funktioner för utvecklare

Kaliforniens guvernör Gavin Newsom lägger in sitt veto mot SB 1047 Lagförslag om AI-säkerhet

Hur går det för Kina i AI-racet? Teknikjättar och nystartade företag tänjer på gränserna

GRATIS PDF EXKLUSIVLigg steget före med DailyAI

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI