Un misterioso chatbot chiamato "gpt2-chatbot" ha suscitato un'immensa eccitazione e speculazione nella comunità dell'intelligenza artificiale.
Questo chatbot, che potete trovare e sperimentare voi stessi sul sito LMSys Chatbot Arenaalcuni utenti sostengono che sia più avanzato degli attuali modelli all'avanguardia, come il GPT-4 e il GPT-4. Claude 3 Opus.
Emersa apparentemente dal nulla, la sua origine è totalmente sconosciuta. Potrebbe trattarsi di un progetto sperimentale di un importante laboratorio di intelligenza artificiale o di una strana fuga di notizie?
C'è un nuovo misterioso modello chiamato gpt2-chatbot accessibile da un importante sito di benchmarking LLM. Nessuno sa chi l'abbia creato o cosa sia, ma io ci ho giocato un po' e sembra che sia allo stesso livello di capacità approssimativa del GPT-4. Un misterioso modello di classe GPT-4? Fantastico! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29 aprile 2024
Gli utenti di Reddit pensano soprattutto che provenga da OpenAI poiché il modello ammette che lo stile e il tono delle risposte sembrano diversi da quelli del GPT-4 e del GPT-4 Turbo, ma il cut-off delle conoscenze differisce da quello attualmente disponibile. OpenAI modelli.
gpt2-chatbot è pazzesco nell'ascii art, molto più avanti di qualsiasi altro modello pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29 aprile 2024
Ho chiesto a gpt2-chatbot stesso: "Chi sei?", e mi ha risposto:
"Sono stato creato da OpenAI, un'organizzazione di ricerca che si concentra sullo sviluppo e la promozione di IA amichevoli a beneficio dell'umanità. Il mio sviluppo si basa sulla serie di modelli linguistici GPT (Generative Pre-trained Transformer), in particolare sulla versione GPT-4, che è un'evoluzione di modelli precedenti come GPT-3. Questi modelli sono addestrati su una vasta gamma di testi internet, ma sono progettati per generare testi simili a quelli umani in base alle richieste ricevute. Questi modelli sono addestrati su una vasta gamma di testi internet, ma sono progettati per generare testi simili a quelli umani in base alle richieste che ricevono.
OpenAI è nata con l'obiettivo di garantire che l'intelligenza artificiale generale (AGI) vada a beneficio di tutta l'umanità. Conduce ricerche nel campo dell'IA con l'obiettivo di sviluppare e indirizzare le tecnologie dell'intelligenza artificiale in modi che vadano a beneficio dell'umanità nel suo complesso, senza essere vincolati da obblighi finanziari nei confronti degli investitori.
Se avete altre domande sull'IA, OpenAI, o tecnologie correlate, sentitevi liberi di chiedere!".
Quando gli ho chiesto perché si chiama gpt2-chatbot, mi ha risposto:
"Per riassumere, non mi chiamo "GPT-2"; sono una variante del GPT-4, progettata specificamente per applicazioni interattive, come questo formato di conversazione. Il mio progetto include miglioramenti nella gestione dei dialoghi, nelle caratteristiche di sicurezza, nelle considerazioni etiche e nella qualità complessiva delle risposte. Se vedete riferimenti a "GPT-2", è probabile che stiano parlando del modello precedente a GPT-3 e GPT-4".
Le prestazioni di gpt2-chatbot provocano speculazioni
Per quanto riguarda le prestazioni, un utente del sito Forum di Y Combinator hanno discusso la conoscenza del dominio del bot nella scienza dei materiali, discutendo della produzione di pale di turbine con una profondità che non avrebbero potuto vedere altrimenti.
Un altro utente, il noto scienziato dei dati Simon Wilson, è rimasto colpito dalla gestione di query altamente personalizzate, che suggerisce una comprensione dettagliata del background personale delle persone.
È possibile provare il misterioso gpt2-chatbot all'indirizzo https://t.co/4ARf9G6RHb (selezionare "Chat diretta" e sceglierla dal menu)
Impressioni iniziali: Sono molto colpito. Mi ha dato una risposta migliore per una ricerca sull'ego ("Chi è Simon Willison?") rispetto a qualsiasi altro modello che ho provato. https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29 aprile 2024
Altri hanno individuato le carenze standard del LLM, come le allucinazioni e le imprecisioni fattuali.
Avendolo usato personalmente, concordo sul fatto che sembra una variante del GPT-4.
Per quanto riguarda la possibilità che sia migliore di GPT-4, come ipotizzato da alcuni, vale la pena sottolineare che molti hanno ritenuto che le prestazioni di GPT-4 siano diminuite nel tempo (forse in coincidenza con OpenAI dedicare risorse di calcolo all'addestramento di nuovi modelli).
Quindi, questa variante potenzialmente non adulterata potrebbe sembrare come il GPT -4 quando uscì per la prima volta. Se a ciò si aggiungono alcune lievi differenze nel comportamento e nelle prestazioni su compiti specifici, si capisce perché le speculazioni siano elevate.
Quando le discussioni su gpt2-chatbot hanno raggiunto X, alcuni hanno inevitabilmente ipotizzato che si tratti di una prova di GPT-4.5, GPT-5 o addirittura di AGI. Tuttavia, molti non sono sicuri che rappresenti un progresso concreto rispetto ai modelli attuali.
Nel complesso, è impossibile che un'azienda di intelligenza artificiale addestri un chatbot completamente nuovo come questo e lo rilasci in questo modo. Si tratta quasi certamente di una variante di GPT-4.
In definitiva, si tratta di dicerie finché il creatore non esce da dietro le tende e ne rivendica la proprietà.