Anthropic frigiver Claude 2.1 med 200k kontekstvindue

Claude.ai er Anthropics svar på ChatGPT, og den AI-model, der driver den, har lige fået en stor opgradering.

Claude 2.1 giver en betydelig forbedring af ydeevnen i forhold til Claude 2.0. Den største opgradering er nok fordoblingen af kontekstvinduet, men der er også nogle andre imponerende funktioner.

Anthropic's blogindlæg går meget mere i detaljer, men her er en forenklet oversigt over opgraderingerne.

Kontekst-vindue

En models kontekstvindue bestemmer, hvor mange tokens den kan have i sin hukommelse. Claude 2.1 har nu et kontekstvindue på 200.000 tokens, dobbelt så meget som Claude 2.0 og det største i branchen. Til sammenligning, GPT-4 Turbo har et 128k kontekstvindue.

Det betyder, at du kan smide omkring 150.000 ord eller 500 sider ind i en chat med Claude og stille spørgsmål til materialet. I hvert fald i teorien.

Greg Kamradt foretog en stresstest af Claude 2.1's genkaldelsesevne, og den kæmpede med nøjagtigheden, når konteksten blev længere, og når det faktum, der skulle genkaldes, var et sted midt i dokumentet.

Claude 2.1 (200K Tokens) - Trykprøvning af genkaldelse af lange kontekster

Vi elsker alle at øge kontekstlængden - men hvordan er det med ydeevnen?

Anthropic kontaktede os med tidlig adgang til Claude 2.1, så jeg gentog den "nål i en høstak"-analyse, jeg lavede på GPT-4

Her er, hvad jeg fandt:... pic.twitter.com/B36KnjtJmE

- Greg Kamradt (@GregKamradt) 21. november 2023

Det er stadig ret imponerende på trods af nogle problemer med tilbagekaldelsesnøjagtigheden.

Mere nøjagtighed og ærlighed

Claude 2.1 laver færre fejl og lyver sjældnere for dig. Det er 30% mere sandsynligt, at han giver et korrekt svar end før.

Ligesom andre AI-modeller vil den stadig hallucinere, men den gør det cirka halvt så meget som Claude 2.0.

Claude 2.1 har også fået en opgradering af sin intellektuelle ydmyghed. Den er også næsten dobbelt så tilbøjelig til at nægte at svare på et spørgsmål, når den ikke kender svaret, i stedet for at finde på noget.

Claude 2.1 nøjagtighed ved besvarelse af svære spørgsmål. Kilde: Anthropic

Brug af API-værktøj

Claude kan nu interagere med en brugers databaser, søge i webressourcer efter et svar eller interagere med andre værktøjer via API'er.

Anthropic siger, at en bruger nu kan definere et sæt værktøjer, stille et spørgsmål, og så vil Claude beslutte, hvilke værktøjer der skal bruges til at besvare spørgsmålet.

Claude er allerede integreret med Zapier, så denne ekstra mulighed for at oversætte naturligt sprog til API- eller funktionsopkald kan blive enorm. Kan vi snart se Anthropics version af OpenAI's GPT'er?

Funktionen til brug af værktøjer er i beta, så vi må vente med at se, hvad den kan.

Systemmeldinger

Denne funktion gør det muligt for et API-kald at give Claude kontekst og instruktioner om, hvordan han skal reagere, før der indtastes en menneskelig prompt.

Det betyder, at du kan få Claude til at antage en bestemt karakter eller stemme og fortælle den ting, den skal eller ikke skal gøre, når den interagerer med brugeren. Efterfølgende interaktioner med Claude vil så få chatsvarene til at forblive i karakteren i længere tid.

Hvis du vil opleve Claude 2.1, kan du gå over til chatgrænsefladen på claude.ai. 200k-kontekstvinduet er kun tilgængeligt for Claude Pro brugere dog.

Anthropic frigiver Claude 2.1 med 200k kontekstvindue

Kontekst-vindue

Mere nøjagtighed og ærlighed

Brug af API-værktøj

Systemmeldinger

Deltag i fremtiden

Eugene van der Watt

RELATEREDE ARTIKLER

AI May Soon Help You Understand What Your Pet Is Trying to Say

Netflix Adds ChatGPT-Powered AI to Stop You From Scrolling Forever

New Skechers AI Store Assistant Rates Outfit and Suggests What to Buy

Ferrari Just Launched an AI App That Lets Fans Experience F1 Like Never Before

Anthropic frigiver Claude 2.1 med 200k kontekstvindue

Kontekst-vindue

Mere nøjagtighed og ærlighed

Brug af API-værktøj

Systemmeldinger

Deltag i fremtiden

Eugene van der Watt

RELATEREDE ARTIKLER

AI May Soon Help You Understand What Your Pet Is Trying to Say

Netflix Adds ChatGPT-Powered AI to Stop You From Scrolling Forever

New Skechers AI Store Assistant Rates Outfit and Suggests What to Buy

Ferrari Just Launched an AI App That Lets Fans Experience F1 Like Never Before

GRATIS PDF EKSKLUSIVTVær på forkant med DailyAI

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI