Anthropic udgiver Claude Sonnet 3.5, som slår GPT-4o

24. juni 2024

  • Anthropic udgav Claude Sonnet 3.5, som nu er den mest kraftfulde model og slår Claude 3 Opus.
  • Claude Sonnet 3.5 tilbyder opgraderede syns- og kodningsevner og et vindue til forhåndsvisning af artefakter.
  • Claude Sonnet 3.5 slår GPT-4o og Gemini 1.5 Pro i flere MMLU-benchmark-tests

Anthropic udgav Claude Sonnet 3.5, som er mere kraftfuld, hurtigere og billigere end den større Claude 3 Opus-model.

Da Anthropic udgav sin Claude 3 familier af modeller i martsDe kom i tre varianter, Haiku, Sonnet og Opus, der hver især steg i størrelse, kapacitet og symbolske omkostninger.

Claude Sonnet 3.5 er betydeligt mere intelligent end sin større forgænger og kommer med en stor opgradering af billedbehandlings- og kodningsfunktionerne.

Det er også meget hurtigere og billigere. Anthropic siger, at inferens med Claude Sonnet 3.5 er dobbelt så hurtig som Claude Opus 3, 5 gange billigere pr. token og også har et kontekstvindue på 200k.

I løbet af bare tre måneder er Claude Opus 3 blevet overflødig, og Anthropic siger, at vi kan forvente opgraderede 3.5-versioner af Haiku og Opus "snart".

Anthropic har gjort modellen gratis tilgængelig på sin hjemmeside. Claude.ai chatgrænseflade og iOS-app. Hvis du tilmelder dig en betalt konto, får du højere hastighedsgrænser og API-adgang.

Claude Sonnet 3.5 benchmark-resultater

Claude Sonnet 3.5 kan ikke søge på internettet eller generere billeder, men dens opgraderede evner inden for billedbehandling, matematik, ræsonnement og kodning slår branchens førende GPT-4o og Gemini Pro 1.5 på en række benchmarks.

Claude Sonnet 3.5 benchmark-sammenligning. Kilde: Anthropic
Claude Sonnet 3.5 benchmark-sammenligning. Kilde: Anthropic

De visuelle matematiske ræsonnementer og kodningsscorerne er de mest fremtrædende tal her, og det er de forbedrede kodningsfærdigheder, der har gjort brugerne særligt begejstrede.

Artefakter

Artifacts-funktionen er en spændende tilføjelse til Claudes webchat-grænseflade. ChatGPT genererer kode til dig, men så skal du kopiere og indsætte den i et udviklingsmiljø for at afprøve den.

Claude har nu et ekstra vindue, der åbnes ved siden af chatgrænsefladen, hvor du kan se en forhåndsvisning af koden i realtid. Redigeringer afspejles straks i Artifacts-vinduet.

Anthropic siger, at Artifacts snart vil understøtte teams og give mulighed for at samarbejde om projekter. Lad os håbe, at ChatGPT snart får sin egen version af Artifacts.

Anthropic sagde, at de underkastede Claude 3.5 Sonnet strenge sikkerhedstests og også gav den til Storbritanniens Artificial Intelligence Safety Institute (UK AISI) til sikkerhedsevaluering før udrulning.

Dens interne sikkerhedsevaluering, offentliggjort i modelkortetklassificerede "Claude 3.5 Sonnet som en AI Safety Level 2 (ASL-2) model, hvilket indikerer, at den ikke udgør en risiko for katastrofal skade."

Anthropic siger, at de ud over opgraderede versioner af Haiku- og Opus-modellerne snart vil tilføje modaliteter, hukommelseskapacitet og flere funktioner til virksomhedsintegration.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser