Claude.ai är Anthropics svar på ChatGPT och AI-modellen som driver den har precis fått en stor uppgradering.
Claude 2.1 ger en betydande förbättring av prestandan jämfört med Claude 2.0. Den största uppgraderingen är förmodligen fördubblingen av kontextfönstret, men det finns också några andra imponerande funktioner.
Anthropic's Blogginlägg går in på mycket mer detaljer men här är en förenklad sammanfattning av uppgraderingarna.
Fönster för kontext
En modells kontextfönster avgör hur många polletter den kan hålla i minnet. Claude 2.1 har nu ett kontextfönster på 200 000 tokens, dubbelt så mycket som Claude 2.0 och det största i branschen. För jämförelse, GPT-4 Turbo har ett 128k kontextfönster.
Det innebär att du kan lägga in cirka 150 000 ord eller 500 sidor i en chatt med Claude och ställa frågor som rör materialet. I alla fall i teorin.
Greg Kamradt gjorde ett stresstest av Claude 2.1:s återkallningsförmåga och det kämpade med noggrannheten när sammanhanget blev längre och när faktumet att återkalla var någonstans i mitten av dokumentet.
Claude 2.1 (200K Tokens) - Trycktestning av återkallande av lång kontext
Vi älskar alla att öka längden på kontexten - men hur är det med prestandan?
Anthropic hörde av sig med tidig tillgång till Claude 2.1 så jag upprepade analysen "nål i en höstack" som jag gjorde på GPT-4
Här är vad jag hittade:... pic.twitter.com/B36KnjtJmE
- Greg Kamradt (@GregKamradt) 21 november 2023
Det är fortfarande ganska imponerande trots vissa problem med återkallningsnoggrannheten.
Mer noggrannhet och ärlighet
Claude 2.1 gör färre misstag och kommer att ljuga för dig mindre ofta. Det är 30% mer sannolikt att han ger ett korrekt svar än tidigare.
Precis som andra AI-modeller kommer den fortfarande att hallucinera, men den gör det ungefär hälften så mycket som Claude 2.0 gör.
Claude 2.1 har också fått en uppgradering av sin intellektuella ödmjukhet. Den är också nästan dubbelt så benägen att avstå från att svara på en fråga när den inte vet svaret i stället för att hitta på något.
Användning av API-verktyg
Claude kan nu interagera med en användares databaser, söka efter svar i webbresurser eller interagera med andra verktyg via API:er.
Anthropic säger att en användare nu kan definiera en uppsättning verktyg, ställa en fråga och sedan kommer Claude att bestämma vilka verktyg som ska användas för att besvara frågan.
Claude integreras redan med Zapier så denna extra förmåga att översätta naturligt språk till API eller funktionsanrop kan vara enorm. Kan vi se Anthropics version av OpenAI:s GPT:er snart?
Funktionen för verktygsanvändning är i betaversion, så vi får vänta och se vad den kan göra.
Systemets anvisningar
Den här funktionen gör det möjligt för ett API-anrop att ge Claude sammanhang och instruktioner om hur han ska svara innan en mänsklig prompt anges.
Det innebär att du kan låta Claude anta en viss karaktär eller röst och tala om för den vad den ska eller inte ska göra när den interagerar med användaren. Efterföljande interaktioner med Claude kommer då att få chattresponsen att stanna kvar i karaktären längre.
Om du vill uppleva Claude 2.1 kan du gå över till chattgränssnittet på claude.ai. Kontextfönstret 200k är endast tillgängligt för Claude Pro användare dock.