En mystisk chatbot med namnet "gpt2-chatbot" har utlöst enorm spänning och spekulationer i AI-communityn.
Denna chatbot, som du kan hitta och experimentera med själv på LMSys Chatbot Arenaav vissa användare anses vara mer avancerad än nuvarande toppmoderna modeller som GPT-4 och Claude 3 Opus.
Den är till synes sprungen ur tomma intet och dess ursprung är helt okänt. Kan det vara ett experimentellt projekt från ett ledande AI-labb eller en märklig läcka?
Det finns en mystisk ny modell som heter gpt2-chatbot som är tillgänglig från en stor LLM-benchmarkingwebbplats. Ingen vet vem som har gjort den eller vad den är, men jag har lekt lite med den och den verkar ligga på samma ungefärliga förmågenivå som GPT-4. En mystisk GPT-4-klassmodell? Snyggt! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29 april 2024
Reddit-användare tror främst att det är från OpenAI eftersom modellen medger att svarsstilen och tonen verkar skilja sig från GPT-4 och GPT-4 Turbo, men kunskapsgränsen skiljer sig från för närvarande tillgängliga OpenAI modeller.
gpt2-chatbot är galen på ascii-konst, mil före alla andra modeller pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29 april 2024
Jag frågade själv gpt2-chatbot "Vem är du", varpå den svarade:
"Jag skapades av OpenAI, en forskningsorganisation som fokuserar på att utveckla och främja vänlig AI till förmån för mänskligheten. Min utveckling är baserad på GPT-serien (Generative Pre-trained Transformer) av språkmodeller, särskilt GPT-4-versionen, som är en utveckling av tidigare modeller som GPT-3. Dessa modeller tränas på en mängd olika internettexter, men de är utformade för att generera människoliknande text baserat på de uppmaningar de får.
OpenAI startades med målet att se till att artificiell allmän intelligens (AGI) gynnar hela mänskligheten. De bedriver forskning inom AI-området i syfte att utveckla och styra teknik för artificiell intelligens på ett sätt som gynnar mänskligheten som helhet, utan att tyngas av finansiella skyldigheter gentemot investerare.
Om du har några fler frågor om AI, OpenAIeller relaterad teknik, tveka inte att fråga!"
När jag frågade den varför den heter gpt2-chatbot svarade den:
"Sammanfattningsvis heter jag inte "GPT-2" utan är en variant av GPT-4, speciellt utformad för interaktiva tillämpningar, såsom detta samtalsformat. Min design inkluderar förbättringar i hanteringen av dialoger, säkerhetsfunktioner, etiska överväganden och övergripande svarskvalitet. Om du ser referenser till "GPT-2" är det sannolikt den modell som föregick GPT-3 och GPT-4 som diskuteras."
gpt2-chatbots prestanda ger upphov till spekulationer
När det gäller prestanda har en användare på Y Combinator forum diskuterade botens domänkunskap inom materialvetenskap och diskuterade tillverkning av turbinblad med ett djup som de inte hade sett annars.
En annan användare, den välkända datavetaren Simon Wilson, var imponerad av dess hantering av mycket personliga frågor, vilket tyder på att den har en detaljerad förståelse för människors personliga bakgrunder.
Du kan prova den mystiska gpt2-chatboten på https://t.co/4ARf9G6RHb (välj "Direct Chat" och välj det från menyn)
Första intrycket: Jag är mycket imponerad. Den gav mig ett bättre svar på en egosökning ("Vem är Simon Willison?") än någon annan modell jag har provat https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29 april 2024
Andra identifierade vanliga LLM-brister, såsom hallucinationer och faktafel.
Efter att ha använt det själv skulle jag hålla med om att det känns som en variant av GPT-4.
När det gäller om det är bättre än GPT-4, som vissa spekulerar i, är det värt att lyfta fram att många ansåg att GPT-4:s prestanda sjönk med tiden (vilket möjligen sammanföll med OpenAI avsätta beräkningsresurser för att utbilda nya modeller).
Så den här potentiellt oförfalskade varianten kan kännas som GPT -4 gjorde när den först kom ut. Lägg till några små skillnader i beteende och prestanda på specifika uppgifter, så förstår du varför spekulationerna är höga.
När diskussioner om gpt2-chatbot träffade X har vissa oundvikligen spekulerat i att det är bevis på GPT-4.5, GPT-5 eller till och med AGI. De flesta är dock osäkra på om det representerar konkreta framsteg jämfört med nuvarande modeller.
Sammantaget finns det inget sätt som ett AI-företag skulle träna en helt ny chatbot som denna och släppa den på ett sådant sätt. Det är nästan säkert en GPT-4-variant.
I slutändan är det hörsägen tills skaparen kliver ut bakom gardinerna och hävdar äganderätten.