Claude.ai is Anthropic's antwoord op ChatGPT en het AI-model dat het aanstuurt heeft net een grote upgrade gekregen.
Claude 2.1 levert een aanzienlijke prestatieverbetering ten opzichte van Claude 2.0. De grootste upgrade is waarschijnlijk de verdubbeling van het contextvenster, maar er zijn ook enkele andere indrukwekkende functies.
Antropisch blogpost gaat in veel meer detail, maar hier is een vereenvoudigde samenvatting van de upgrades.
Contextvenster
Het contextvenster van een model bepaalt hoeveel tokens het in zijn geheugen kan bewaren. Claude 2.1 heeft nu een contextvenster van 200.000 tokens, het dubbele van dat van Claude 2.0 en het grootste in de industrie. Ter vergelijking, GPT-4 Turbo heeft een contextvenster van 128k.
Dit betekent dat je ongeveer 150.000 woorden of 500 pagina's in een chat met Claude kunt stoppen en vragen kunt stellen over het materiaal. Nou ja, in theorie.
Greg Kamradt deed een stresstest van de terugroepfunctie van Claude 2.1 en het worstelde met de nauwkeurigheid naarmate de context langer werd en wanneer het terug te roepen feit zich ergens in het midden van het document bevond.
Claude 2.1 (200K Tokens) - Druktest Lange Contextherinnering
We zijn allemaal dol op het vergroten van contextlengtes - maar hoe zijn de prestaties?
Anthropic bood vroege toegang tot Claude 2.1, dus ik herhaalde de "naald in een hooiberg" analyse die ik deed op GPT-4
Dit is wat ik vond:... pic.twitter.com/B36KnjtJmE
- Greg Kamradt (@GregKamradt) 21 november 2023
Het is nog steeds behoorlijk indrukwekkend, ondanks enkele problemen met de nauwkeurigheid van terugroepen.
Meer nauwkeurigheid en eerlijkheid
Claude 2.1 maakt minder fouten en zal minder vaak tegen je liegen. Hij geeft 30% vaker een goed antwoord dan voorheen.
Net als andere AI-modellen hallucineert hij nog steeds, maar hij doet dat ongeveer half zo vaak als Claude 2.0.
Claude 2.1 heeft ook een upgrade gekregen in zijn intellectuele nederigheid. Het is ook bijna twee keer zo waarschijnlijk om een vraag niet te beantwoorden als het het antwoord niet weet, in plaats van iets te verzinnen.
Gebruik API-tool
Claude kan nu interageren met de databases van een gebruiker, zoeken in webbronnen voor een antwoord of interageren met andere tools via API's.
Anthropic zegt dat een gebruiker nu een set tools kan definiëren, een vraag kan stellen en dat Claude dan beslist welke tools hij moet gebruiken om de vraag te beantwoorden.
Claude integreert al met Zapier, dus deze extra mogelijkheid om natuurlijke taal te vertalen naar API's of functie-aanroepen zou enorm kunnen zijn. Zouden we binnenkort Anthropic's versie van OpenAI's GPT's kunnen zien?
De functie voor het gebruik van gereedschappen is nog in bèta, dus we zullen moeten wachten om te zien waartoe deze in staat is.
Systeemprompts
Met deze functie kan een API-aanroep Claude context en instructies geven over hoe te reageren voordat een menselijke prompt wordt ingevoerd.
Dit betekent dat je Claude een bepaald personage of een bepaalde stem kunt laten aannemen en hem kunt vertellen wat hij wel of niet moet doen tijdens de interactie met de gebruiker. Latere interacties met Claude zorgen er dan voor dat de chatreacties langer in karakter blijven.
Als je Claude 2.1 wilt ervaren, kun je naar de chatinterface gaan op claude.ai. Het 200k contextvenster is alleen beschikbaar voor Claude Pro gebruikers.