Een mysterieuze chatbot met de naam 'gpt2-chatbot' heeft tot enorme opwinding en speculatie geleid in de AI-gemeenschap.
Deze chatbot, die je kunt vinden en er zelf mee kunt experimenteren op de LMSys Chatbot Arenawordt door sommige gebruikers aangeprezen als geavanceerder dan de huidige geavanceerde modellen zoals GPT-4 en Claude 3 Opus.
Het lijkt uit de lucht te zijn komen vallen en de oorsprong ervan is totaal onbekend. Zou het een experimenteel project kunnen zijn van een toonaangevend AI-lab of een vreemd lek?
Er is een mysterieus nieuw model genaamd gpt2-chatbot beschikbaar op een grote LLM benchmarking site. Niemand weet wie het gemaakt heeft of wat het is, maar ik heb er een beetje mee gespeeld en het lijkt grofweg op hetzelfde niveau te zitten als GPT-4. Een mysterieus GPT-4 klasse model? Leuk! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29 april 2024
Reddit-gebruikers denken vooral dat het van OpenAI aangezien het model toegeeft dat de antwoordstijl en toon verschillen van GPT-4 en GPT-4 Turbo, maar de kennis cut-off verschilt van de momenteel beschikbare OpenAI modellen.
gpt2-chatbot is waanzinnig in ascii-kunst, mijlenver voor op elk ander model pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29 april 2024
Ik vroeg gpt2-chatbot zelf, "Wie ben jij?", waarop hij antwoordde:
"Ik ben gemaakt door OpenAI, een onderzoeksorganisatie die zich richt op het ontwikkelen en bevorderen van vriendelijke AI ten behoeve van de mensheid. Mijn ontwikkeling is gebaseerd op de GPT (Generative Pre-trained Transformer) serie taalmodellen, in het bijzonder de GPT-4 versie, die een evolutie is van eerdere modellen zoals GPT-3. Deze modellen worden getraind op diverse soorten internettekst, maar ze zijn ontworpen om mensachtige tekst te genereren op basis van de aanwijzingen die ze krijgen. Deze modellen zijn getraind op een breed scala aan internetteksten, maar ze zijn ontworpen om mensachtige tekst te genereren op basis van de prompts die ze ontvangen.
OpenAI gestart met het doel ervoor te zorgen dat kunstmatige algemene intelligentie (AGI) de hele mensheid ten goede komt. Ze doen onderzoek op het gebied van AI met als doel kunstmatige intelligentietechnologieën te ontwikkelen en te gebruiken op manieren die de hele mensheid ten goede komen, zonder financiële verplichtingen aan investeerders.
Als je nog vragen hebt over AI, OpenAIof aanverwante technologieën, vraag er gerust naar!"
Toen ik hem vroeg waarom hij gpt2-chatbot heet, antwoordde hij:
"Samenvattend, ik heet niet "GPT-2"; ik ben een variant van GPT-4, speciaal ontworpen voor interactieve toepassingen, zoals dit gespreksformaat. Mijn ontwerp bevat verbeteringen in het afhandelen van dialogen, veiligheidsfuncties, ethische overwegingen en algehele responskwaliteit. Als je verwijzingen ziet naar 'GPT-2', gaat het waarschijnlijk over het model dat voorafging aan GPT-3 en GPT-4."
gpt2-chatbot's prestaties lokken speculatie uit
Wat de prestaties betreft, heeft een gebruiker op de Y Combinator forum bespraken de domeinkennis van de bot in de materiaalkunde, waarbij ze de productie van turbinebladen bespraken met een diepgang die ze anders niet hadden gezien.
Een andere gebruiker, de bekende datawetenschapper Simon Wilson, was onder de indruk van de afhandeling van zeer persoonlijke zoekopdrachten, wat suggereert dat het een gedetailleerd begrip heeft van de persoonlijke achtergronden van mensen.
Je kunt de mysterieuze gpt2-chatbot uitproberen op https://t.co/4ARf9G6RHb (selecteer "Directe chat" en kies dit uit het menu)
Eerste indrukken: Ik ben erg onder de indruk. Het gaf me een beter antwoord op een zoekopdracht naar mijn ego ("Wie is Simon Willison?") dan elk ander model dat ik heb geprobeerd. https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29 april 2024
Anderen wezen op de standaard tekortkomingen van LLM, zoals hallucinaties en feitelijke onjuistheden.
Nu ik het zelf heb gebruikt, ben ik het ermee eens dat het aanvoelt als een variant van GPT-4.
Wat betreft de vraag of het beter is dan GPT-4, zoals sommigen speculeren, is het de moeite waard om te benadrukken dat velen vonden dat de prestaties van GPT-4 na verloop van tijd afnamen (mogelijk samenvallend met OpenAI computermiddelen inzetten om nieuwe modellen te trainen).
Deze potentieel onvervalste variant zou dus kunnen aanvoelen zoals GPT -4 deed toen het voor het eerst uitkwam. Gooi er wat kleine verschillen in gedrag en prestaties bij specifieke taken bij en je kunt zien waarom de speculatie hoog is.
Toen discussies over gpt2-chatbot X bereikten, speculeerden sommigen onvermijdelijk dat het bewijs is voor GPT-4.5, GPT-5 of zelfs AGI. De meesten weten echter niet zeker of het een concrete vooruitgang is ten opzichte van de huidige modellen.
In het algemeen is het ondenkbaar dat een AI-bedrijf een compleet nieuwe chatbot als deze zou trainen en op zo'n manier zou uitbrengen. Het is bijna zeker een GPT-4 variant.
Uiteindelijk is het van horen zeggen totdat de maker achter de gordijnen vandaan komt en het eigendom opeist.