En mystisk chatbot med navnet "gpt2-chatbot" har utløst enorm spenning og spekulasjoner i AI-miljøet.
Denne chatboten, som du kan finne og eksperimentere med selv på LMSys Chatbot Arenaav noen brukere som mer avansert enn dagens toppmoderne modeller som GPT-4 og Claude 3 Opus.
Den dukker tilsynelatende opp ut av løse luften, og dens opprinnelse er totalt ukjent. Kan det være et eksperimentelt prosjekt fra et ledende AI-laboratorium eller en merkelig lekkasje?
Det er en mystisk ny modell kalt gpt2-chatbot tilgjengelig fra et stort LLM-benchmarking-nettsted. Ingen vet hvem som har laget den eller hva den er, men jeg har lekt litt med den, og den ser ut til å være på samme nivå som GPT-4. En mystisk GPT-4-klassemodell? Neat! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29. april 2024
Reddit-brukere tror hovedsakelig det er fra OpenAI siden modellen innrømmer at svarstilen og tonen virker forskjellig fra GPT-4 og GPT-4 Turbo, men kunnskapsgrensen skiller seg fra dagens tilgjengelige OpenAI modeller.
gpt2-chatbot er vanvittig god på ascii-kunst, milevis foran alle andre modeller pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29. april 2024
Jeg spurte selv gpt2-chatbot: "Hvem er du?", og den svarte:
"Jeg ble skapt av OpenAI, en forskningsorganisasjon som fokuserer på å utvikle og fremme vennlig AI til fordel for menneskeheten. Min utvikling er basert på GPT-serien (Generative Pre-trained Transformer) av språkmodeller, nærmere bestemt GPT-4-versjonen, som er en videreutvikling av tidligere modeller som GPT-3. Disse modellene er trent på et bredt spekter av internett-tekster, men de er designet for å generere menneskelignende tekst basert på instruksjonene de mottar.
OpenAI startet med målet om å sikre at kunstig generell intelligens (AGI) skal komme hele menneskeheten til gode. De driver forskning innen kunstig intelligens med sikte på å utvikle og styre kunstig intelligens-teknologier på måter som kommer hele menneskeheten til gode, uten å være bundet av økonomiske forpliktelser overfor investorer.
Hvis du har flere spørsmål om AI, OpenAIeller relaterte teknologier, spør gjerne!"
Da jeg spurte den om hvorfor den heter gpt2-chatbot, svarte den:
"For å oppsummere: Jeg heter ikke "GPT-2"; jeg er en variant av GPT-4, designet spesielt for interaktive applikasjoner, som dette samtaleformatet. Min design inkluderer forbedringer i håndtering av dialoger, sikkerhetsfunksjoner, etiske hensyn og generell responskvalitet. Hvis du ser referanser til "GPT-2", er det sannsynligvis modellen som kom før GPT-3 og GPT-4 som omtales."
gpt2-chatbots prestasjoner vekker spekulasjoner
Når det gjelder ytelse, var det en bruker på Y Combinator-forum diskuterte botens domenekunnskap innen materialvitenskap, og diskuterte produksjon av turbinblader med en dybde de ellers ikke hadde vært vitne til.
En annen bruker, den kjente dataforskeren Simon Wilson, var imponert over hvordan den håndterer svært personaliserte spørsmål, noe som tyder på at den har en detaljert forståelse av folks personlige bakgrunn.
Du kan prøve den mystiske gpt2-chatbot på https://t.co/4ARf9G6RHb (velg "Direct Chat" og velg det fra menyen)
Innledende inntrykk: Jeg er veldig imponert. Den ga meg et bedre svar på et egosøk ("Hvem er Simon Willison?") enn noen annen modell jeg har prøvd https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29. april 2024
Andre identifiserte vanlige LLM-mangler, som hallusinasjoner og faktafeil.
Etter å ha brukt det selv, er jeg enig i at det føles som en variant av GPT-4.
Når det gjelder hvorvidt den er bedre enn GPT-4, som noen spekulerer i, er det verdt å understreke at mange mente at GPT-4s ytelse falt over tid (muligens sammenfallende med OpenAI bruke dataressurser på å trene opp nye modeller).
Så denne potensielt uforfalskede varianten kan føles som GPT -4 gjorde da den først kom ut. Legg til noen små forskjeller i oppførsel og ytelse på spesifikke oppgaver, så skjønner du hvorfor spekulasjonene er høye.
Etter hvert som diskusjonene om gpt2-chatbot har nådd X, har noen uunngåelig spekulert i om det er bevis på GPT-4.5, GPT-5 eller til og med AGI. De fleste er imidlertid usikre på om det representerer et konkret fremskritt i forhold til dagens modeller.
Samlet sett er det ingen måte et AI-selskap ville trene opp en helt ny chatbot som dette og slippe den på en slik måte. Det er nesten helt sikkert en GPT-4-variant.
Til syvende og sist er det bare rykter, helt til opphavspersonen trer frem fra bak gardinene og hevder eierskap.