Un mystérieux chatbot appelé "gpt2-chatbot" a suscité une grande excitation et des spéculations au sein de la communauté de l'IA.
Ce chatbot, que vous pouvez trouver et expérimenter vous-même sur le site Web de la LMSys Chatbot ArenaCertains utilisateurs affirment qu'il est plus avancé que les modèles de pointe actuels tels que le GPT-4 et le Claude 3 Opus.
Son origine est totalement inconnue. S'agit-il d'un projet expérimental d'un grand laboratoire d'intelligence artificielle ou d'une étrange fuite ?
Il existe un nouveau modèle mystérieux appelé gpt2-chatbot accessible sur un site majeur de benchmarking LLM. Personne ne sait qui l'a créé ou ce qu'il est, mais j'ai joué un peu avec et il semble être dans le même niveau de capacité que le GPT-4. Un mystérieux modèle de classe GPT-4 ? Super ! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29 avril 2024
Les utilisateurs de Reddit pensent surtout qu'il s'agit de OpenAI puisque le modèle admet que le style et le ton des réponses semblent différents de ceux du GPT-4 et du GPT-4 Turbo, mais que le seuil de connaissances diffère de celui actuellement disponible. OpenAI modèles.
gpt2-chatbot est fou d'art ascii, à mille lieues de tout autre modèle pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29 avril 2024
J'ai demandé à gpt2-chatbot : "Qui es-tu ?", ce à quoi il a répondu :
"J'ai été créé par OpenAIune organisation de recherche qui se concentre sur le développement et la promotion d'une IA conviviale pour le bénéfice de l'humanité. Mon développement est basé sur la série de modèles de langage GPT (Generative Pre-trained Transformer), en particulier la version GPT-4, qui est une évolution des modèles précédents comme le GPT-3. Ces modèles sont entraînés sur un large éventail de textes Internet, mais ils sont conçus pour générer des textes de type humain en fonction des messages qu'ils reçoivent.
OpenAI a été créée dans le but de faire en sorte que l'intelligence artificielle générale (AGI) profite à l'ensemble de l'humanité. Elle mène des recherches dans le domaine de l'IA dans le but de développer et d'orienter les technologies d'intelligence artificielle de manière à ce qu'elles profitent à l'ensemble de l'humanité, sans s'encombrer d'obligations financières à l'égard des investisseurs.
Si vous avez d'autres questions sur l'IA, OpenAIou des technologies connexes, n'hésitez pas à demander !"
Lorsque je lui ai demandé pourquoi il s'appelait gpt2-chatbot, il m'a répondu :
"Pour résumer, je ne m'appelle pas "GPT-2" ; je suis une variante de GPT-4, conçue spécifiquement pour des applications interactives, telles que ce format conversationnel. Ma conception inclut des améliorations dans le traitement des dialogues, des caractéristiques de sécurité, des considérations éthiques et la qualité globale des réponses. Si vous voyez des références à "GPT-2", il s'agit probablement du modèle qui a précédé GPT-3 et GPT-4".
Les performances de gpt2-chatbot suscitent des spéculations
En ce qui concerne les performances, un utilisateur de la Forum Y Combinator ont discuté des connaissances du bot dans le domaine de la science des matériaux, en abordant la fabrication des pales de turbines avec une profondeur qu'ils n'auraient pas connue autrement.
Un autre utilisateur, le célèbre scientifique Simon Wilson, a été impressionné par le traitement des requêtes hautement personnalisées, ce qui suggère une compréhension détaillée des antécédents personnels des gens.
Vous pouvez essayer le mystérieux gpt2-chatbot à l'adresse suivante https://t.co/4ARf9G6RHb (sélectionnez "Direct Chat" et choisissez-le dans le menu)
Premières impressions : Je suis très impressionné. Il m'a donné une meilleure réponse à une recherche d'ego ("Qui est Simon Willison ?") que n'importe quel autre modèle que j'ai essayé. https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29 avril 2024
D'autres ont identifié les lacunes habituelles du LLM, telles que les hallucinations et les inexactitudes factuelles.
Pour l'avoir utilisé moi-même, je suis d'accord pour dire qu'il ressemble à une variante du GPT-4.
Quant à savoir s'il est meilleur que le GPT-4, comme certains le supposent, il convient de souligner que de nombreuses personnes ont estimé que les performances du GPT-4 diminuaient avec le temps (ce qui coïncide peut-être avec le fait que le GPT-4 n'a pas été mis en place). OpenAI consacrer des ressources informatiques à la formation de nouveaux modèles).
Ainsi, cette variante potentiellement non altérée pourrait ressembler à la GPT -4 lorsqu'elle est apparue pour la première fois. Ajoutez à cela de légères différences de comportement et de performances sur des tâches spécifiques, et vous comprendrez pourquoi les spéculations vont bon train.
Lorsque les discussions sur le gpt2-chatbot ont commencé, certains ont inévitablement pensé qu'il s'agissait d'une preuve du GPT-4.5, du GPT-5 ou même de l'AGI. Cependant, la plupart ne sont pas sûrs qu'il s'agisse d'un progrès concret par rapport aux modèles actuels.
Dans l'ensemble, il est impossible qu'une entreprise spécialisée dans l'IA forme un chatbot entièrement nouveau comme celui-ci et le mette en circulation de cette manière. Il s'agit très certainement d'une variante de GPT-4.
En fin de compte, il s'agit d'un ouï-dire jusqu'à ce que le créateur sorte de derrière les rideaux et en revendique la propriété.