Claude.ai er Anthropics svar på ChatGPT, og den AI-model, der driver den, har lige fået en stor opgradering.
Claude 2.1 giver en betydelig forbedring af ydeevnen i forhold til Claude 2.0. Den største opgradering er nok fordoblingen af kontekstvinduet, men der er også nogle andre imponerende funktioner.
Anthropic's blogindlæg går meget mere i detaljer, men her er en forenklet oversigt over opgraderingerne.
Kontekst-vindue
En models kontekstvindue bestemmer, hvor mange tokens den kan have i sin hukommelse. Claude 2.1 har nu et kontekstvindue på 200.000 tokens, dobbelt så meget som Claude 2.0 og det største i branchen. Til sammenligning, GPT-4 Turbo har et 128k kontekstvindue.
Det betyder, at du kan smide omkring 150.000 ord eller 500 sider ind i en chat med Claude og stille spørgsmål til materialet. I hvert fald i teorien.
Greg Kamradt foretog en stresstest af Claude 2.1's genkaldelsesevne, og den kæmpede med nøjagtigheden, når konteksten blev længere, og når det faktum, der skulle genkaldes, var et sted midt i dokumentet.
Claude 2.1 (200K Tokens) - Trykprøvning af genkaldelse af lange kontekster
Vi elsker alle at øge kontekstlængden - men hvordan er det med ydeevnen?
Anthropic kontaktede os med tidlig adgang til Claude 2.1, så jeg gentog den "nål i en høstak"-analyse, jeg lavede på GPT-4
Her er, hvad jeg fandt:... pic.twitter.com/B36KnjtJmE
- Greg Kamradt (@GregKamradt) 21. november 2023
Det er stadig ret imponerende på trods af nogle problemer med tilbagekaldelsesnøjagtigheden.
Mere nøjagtighed og ærlighed
Claude 2.1 laver færre fejl og lyver sjældnere for dig. Det er 30% mere sandsynligt, at han giver et korrekt svar end før.
Ligesom andre AI-modeller vil den stadig hallucinere, men den gør det cirka halvt så meget som Claude 2.0.
Claude 2.1 har også fået en opgradering af sin intellektuelle ydmyghed. Den er også næsten dobbelt så tilbøjelig til at nægte at svare på et spørgsmål, når den ikke kender svaret, i stedet for at finde på noget.
Brug af API-værktøj
Claude kan nu interagere med en brugers databaser, søge i webressourcer efter et svar eller interagere med andre værktøjer via API'er.
Anthropic siger, at en bruger nu kan definere et sæt værktøjer, stille et spørgsmål, og så vil Claude beslutte, hvilke værktøjer der skal bruges til at besvare spørgsmålet.
Claude er allerede integreret med Zapier, så denne ekstra mulighed for at oversætte naturligt sprog til API- eller funktionsopkald kan blive enorm. Kan vi snart se Anthropics version af OpenAI's GPT'er?
Funktionen til brug af værktøjer er i beta, så vi må vente med at se, hvad den kan.
Systemmeldinger
Denne funktion gør det muligt for et API-kald at give Claude kontekst og instruktioner om, hvordan han skal reagere, før der indtastes en menneskelig prompt.
Det betyder, at du kan få Claude til at antage en bestemt karakter eller stemme og fortælle den ting, den skal eller ikke skal gøre, når den interagerer med brugeren. Efterfølgende interaktioner med Claude vil så få chatsvarene til at forblive i karakteren i længere tid.
Hvis du vil opleve Claude 2.1, kan du gå over til chatgrænsefladen på claude.ai. 200k-kontekstvinduet er kun tilgængeligt for Claude Pro brugere dog.