Den mystiska "gpt2-chatbot": ett överraskande genombrott inom AI?

29 april 2024

  • En oidentifierad chatbot, "gpt2-chatbot", dök upp på LMSys Chatbot Arena
  • Testare säger att den anmärkningsvärt konkurrerar med eller slår GPT-4 och Claude 3 Opus
  • Ingen vet var den kommer ifrån, men den verkar vara en OpenAI-skapelse
GPT-2

En mystisk chatbot med namnet "gpt2-chatbot" har utlöst enorm spänning och spekulationer i AI-communityn.

Denna chatbot, som du kan hitta och experimentera med själv på LMSys Chatbot Arenaav vissa användare anses vara mer avancerad än nuvarande toppmoderna modeller som GPT-4 och Claude 3 Opus.

Den är till synes sprungen ur tomma intet och dess ursprung är helt okänt. Kan det vara ett experimentellt projekt från ett ledande AI-labb eller en märklig läcka? 

Reddit-användare tror främst att det är från OpenAI eftersom modellen medger att svarsstilen och tonen verkar skilja sig från GPT-4 och GPT-4 Turbo, men kunskapsgränsen skiljer sig från för närvarande tillgängliga OpenAI modeller. 

Jag frågade själv gpt2-chatbot "Vem är du", varpå den svarade:

"Jag skapades av OpenAI, en forskningsorganisation som fokuserar på att utveckla och främja vänlig AI till förmån för mänskligheten. Min utveckling är baserad på GPT-serien (Generative Pre-trained Transformer) av språkmodeller, särskilt GPT-4-versionen, som är en utveckling av tidigare modeller som GPT-3. Dessa modeller tränas på en mängd olika internettexter, men de är utformade för att generera människoliknande text baserat på de uppmaningar de får.

OpenAI startades med målet att se till att artificiell allmän intelligens (AGI) gynnar hela mänskligheten. De bedriver forskning inom AI-området i syfte att utveckla och styra teknik för artificiell intelligens på ett sätt som gynnar mänskligheten som helhet, utan att tyngas av finansiella skyldigheter gentemot investerare.

Om du har några fler frågor om AI, OpenAIeller relaterad teknik, tveka inte att fråga!"

När jag frågade den varför den heter gpt2-chatbot svarade den:

"Sammanfattningsvis heter jag inte "GPT-2" utan är en variant av GPT-4, speciellt utformad för interaktiva tillämpningar, såsom detta samtalsformat. Min design inkluderar förbättringar i hanteringen av dialoger, säkerhetsfunktioner, etiska överväganden och övergripande svarskvalitet. Om du ser referenser till "GPT-2" är det sannolikt den modell som föregick GPT-3 och GPT-4 som diskuteras."

gpt2-chatbots prestanda ger upphov till spekulationer

När det gäller prestanda har en användare på Y Combinator forum diskuterade botens domänkunskap inom materialvetenskap och diskuterade tillverkning av turbinblad med ett djup som de inte hade sett annars. 

En annan användare, den välkända datavetaren Simon Wilson, var imponerad av dess hantering av mycket personliga frågor, vilket tyder på att den har en detaljerad förståelse för människors personliga bakgrunder.

Andra identifierade vanliga LLM-brister, såsom hallucinationer och faktafel.

Efter att ha använt det själv skulle jag hålla med om att det känns som en variant av GPT-4. 

När det gäller om det är bättre än GPT-4, som vissa spekulerar i, är det värt att lyfta fram att många ansåg att GPT-4:s prestanda sjönk med tiden (vilket möjligen sammanföll med OpenAI avsätta beräkningsresurser för att utbilda nya modeller).

Så den här potentiellt oförfalskade varianten kan kännas som GPT -4 gjorde när den först kom ut. Lägg till några små skillnader i beteende och prestanda på specifika uppgifter, så förstår du varför spekulationerna är höga. 

När diskussioner om gpt2-chatbot träffade X har vissa oundvikligen spekulerat i att det är bevis på GPT-4.5, GPT-5 eller till och med AGI. De flesta är dock osäkra på om det representerar konkreta framsteg jämfört med nuvarande modeller. 

Sammantaget finns det inget sätt som ett AI-företag skulle träna en helt ny chatbot som denna och släppa den på ett sådant sätt. Det är nästan säkert en GPT-4-variant.

I slutändan är det hörsägen tills skaparen kliver ut bakom gardinerna och hävdar äganderätten.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar