En mystisk chatbot ved navn 'gpt2-chatbot' har udløst enorm spænding og spekulation i hele AI-samfundet.
Denne chatbot, som du selv kan finde og eksperimentere med på LMSys Chatbot Arenaer af nogle brugere udråbt til at være mere avanceret end nuværende state-of-the-art modeller som GPT-4 og Claude 3 Opus.
Den opstod tilsyneladende ud af den blå luft, og dens oprindelse er helt ukendt. Kan det være et eksperimentelt projekt fra et førende AI-laboratorium eller en mærkelig lækage?
Der er en mystisk ny model kaldet gpt2-chatbot, som er tilgængelig fra et stort LLM-benchmarkingsite. Ingen ved, hvem der har lavet den, eller hvad den er, men jeg har leget lidt med den, og den ser ud til at være på nogenlunde samme niveau som GPT-4. En mystisk GPT-4-klassemodel? Sejt! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29. april 2024
Reddit-brugere tror primært, at det er fra OpenAI da modellen indrømmer, at svarstilen og tonen synes at være forskellig fra GPT-4 og GPT-4 Turbo, men vidensgrænsen adskiller sig fra den aktuelt tilgængelige OpenAI modeller.
gpt2-chatbot er vanvittig til ascii-kunst, milevidt foran enhver anden model pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29. april 2024
Jeg spurgte selv gpt2-chatbot: "Hvem er du?", hvortil den svarede:
"Jeg blev skabt af OpenAIEn forskningsorganisation, der fokuserer på at udvikle og fremme venlig AI til gavn for menneskeheden. Min udvikling er baseret på GPT-serien (Generative Pre-trained Transformer) af sprogmodeller, nærmere bestemt GPT-4-versionen, som er en videreudvikling af tidligere modeller som GPT-3. Disse modeller er trænet på en bred vifte af internettekster, men de er designet til at generere menneskelignende tekst baseret på de beskeder, de modtager.
OpenAI startede med det mål at sikre, at kunstig generel intelligens (AGI) kommer hele menneskeheden til gode. De udfører forskning inden for kunstig intelligens med det formål at udvikle og styre kunstig intelligens-teknologier på måder, der gavner menneskeheden som helhed, uden at være hæmmet af økonomiske forpligtelser over for investorer.
Hvis du har flere spørgsmål om AI, OpenAIeller relaterede teknologier, er du velkommen til at spørge!"
Da jeg spurgte den, hvorfor den hedder gpt2-chatbot, svarede den:
"For at opsummere hedder jeg ikke "GPT-2"; jeg er en variant af GPT-4, der er designet specielt til interaktive applikationer, som f.eks. dette samtaleformat. Mit design omfatter forbedringer i håndteringen af dialoger, sikkerhedsfunktioner, etiske overvejelser og den overordnede responskvalitet. Hvis du ser henvisninger til "GPT-2", er der sandsynligvis tale om den model, der kom før GPT-3 og GPT-4."
gpt2-chatbots præstation giver anledning til spekulationer
Med hensyn til ydeevne var der en bruger på Y Combinator-forum diskuterede bottens domæneviden inden for materialevidenskab og diskuterede fremstilling af turbineblade med en dybde, som de ellers ikke havde set.
En anden bruger, den kendte dataforsker Simon Wilson, var imponeret over dens håndtering af meget personlige forespørgsler, hvilket tyder på, at den har en detaljeret forståelse af folks personlige baggrunde.
Du kan prøve den mystiske gpt2-chatbot på https://t.co/4ARf9G6RHb (vælg "Direkte chat" og vælg det fra menuen)
Første indtryk: Jeg er meget imponeret. Den gav mig et bedre svar på en ego-søgning ("Hvem er Simon Willison?") end nogen anden model, jeg har prøvet. https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29. april 2024
Andre identificerede almindelige LLM-mangler, såsom hallucinationer og faktuelle unøjagtigheder.
Jeg har selv brugt det, og jeg er enig i, at det føles som en variant af GPT-4.
Med hensyn til, om det er bedre end GPT-4, som nogle spekulerer i, er det værd at fremhæve, at mange følte, at GPT-4's ydeevne faldt med tiden (muligvis sammenfaldende med OpenAI dedikere computerressourcer til at træne nye modeller).
Så denne potentielt uforfalskede variant kan føles, som GPT -4 gjorde, da den først kom frem. Læg dertil nogle små forskelle i adfærd og ydeevne i forbindelse med specifikke opgaver, og du kan se, hvorfor spekulationerne er store.
Da diskussionerne om gpt2-chatbot ramte X, har nogle uundgåeligt spekuleret i, at det er bevis på GPT-4.5, GPT-5 eller endda AGI. De fleste er dog usikre på, om det repræsenterer et konkret fremskridt i forhold til de nuværende modeller.
Alt i alt er der ingen måde, hvorpå en AI-virksomhed ville træne en helt ny chatbot som denne og frigive den på en sådan måde. Det er næsten helt sikkert en GPT-4-variant.
I sidste ende er det rygter, indtil skaberen træder frem bag gardinerne og hævder sit ejerskab.