Un misterioso chatbot llamado "gpt2-chatbot" ha suscitado gran expectación y especulación en la comunidad de la IA.
Este chatbot, que puedes encontrar y experimentar por ti mismo en el LMSys Chatbot Arenaes considerado por algunos usuarios más avanzado que los modelos actuales de última generación, como GPT-4 y Claude 3 Opus.
Surgido aparentemente de la nada, sus orígenes son totalmente desconocidos. ¿Podría tratarse de un proyecto experimental de un importante laboratorio de inteligencia artificial o de una extraña filtración?
Hay un misterioso nuevo modelo llamado gpt2-chatbot accesible desde un importante sitio de benchmarking LLM. Nadie sabe quién lo ha fabricado ni qué es, pero he estado jugando un poco con él y parece estar en el mismo nivel aproximado de capacidad que el GPT-4. ¿Un misterioso modelo de clase GPT-4? Genial. pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29 de abril de 2024
Los usuarios de Reddit piensan principalmente que es de OpenAI ya que el modelo admite que el estilo y el tono de la respuesta parecen diferentes de GPT-4 y GPT-4 Turbo, pero el corte de conocimientos difiere del disponible actualmente OpenAI modelos.
gpt2-chatbot es una locura en el arte ascii, millas por delante de cualquier otro modelo pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29 de abril de 2024
Yo mismo le pregunté a gpt2-chatbot: "¿Quién eres?", a lo que me respondió:
"Fui creado por OpenAIuna organización de investigación que se centra en el desarrollo y la promoción de IA amigable en beneficio de la humanidad. Mi desarrollo se basa en la serie de modelos lingüísticos GPT (Generative Pre-trained Transformer), concretamente en la versión GPT-4, que es una evolución de modelos anteriores como el GPT-3. Estos modelos se entrenan con una amplia gama de textos de Internet, pero están diseñados para generar textos similares a los humanos basándose en las indicaciones que reciben.
OpenAI comenzó con el objetivo de garantizar que la inteligencia artificial general (IAG) beneficie a toda la humanidad. Llevan a cabo investigaciones en el campo de la IA con el objetivo de desarrollar y dirigir las tecnologías de inteligencia artificial de forma que beneficien a la humanidad en su conjunto, sin el lastre de las obligaciones financieras con los inversores.
Si tiene más preguntas sobre AI, OpenAIo tecnologías relacionadas, no dude en preguntar".
Cuando le pregunté por qué se llamaba gpt2-chatbot, me respondió:
"Para resumir, no me llamo "GPT-2"; soy una variante de GPT-4, diseñada específicamente para aplicaciones interactivas, como este formato conversacional. Mi diseño incluye mejoras en el manejo de los diálogos, características de seguridad, consideraciones éticas y calidad general de la respuesta. Si ve referencias a "GPT-2", es probable que estén hablando del modelo anterior a GPT-3 y GPT-4".
El rendimiento de gpt2-chatbot provoca especulaciones
En cuanto al rendimiento, un usuario del Foro de Y Combinator debatieron sobre los conocimientos del robot en ciencia de materiales y hablaron de la fabricación de álabes de turbina con una profundidad que no habrían visto de otro modo.
Otro usuario, el conocido científico de datos Simon Wilson, quedó impresionado por su gestión de las consultas altamente personalizadas, lo que sugiere que tiene un conocimiento detallado de los antecedentes personales de la gente.
Puede probar el misterioso gpt2-chatbot en https://t.co/4ARf9G6RHb (seleccione "Chat directo" y elíjalo en el menú)
Impresiones iniciales: Estoy muy impresionado. Me dio una respuesta mejor para una búsqueda de ego ("¿Quién es Simon Willison?") que cualquier otro modelo que haya probado...". https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29 de abril de 2024
Otros señalaron las deficiencias habituales de los LLM, como alucinaciones e inexactitudes factuales.
Habiéndolo utilizado yo mismo, estoy de acuerdo en que parece una variante del GPT-4.
En cuanto a si es mejor que la GPT-4, como algunos especulan, cabe destacar que muchos opinaban que el rendimiento de la GPT-4 disminuía con el tiempo (posiblemente coincidiendo con OpenAI dedicar recursos informáticos al entrenamiento de nuevos modelos).
Así pues, esta variante potencialmente no adulterada podría parecerse a GPT -4 cuando se lanzó por primera vez. Si a esto le añadimos una ligera diferenciación en el comportamiento y el rendimiento en tareas específicas, podemos entender por qué hay tanta especulación.
Cuando las discusiones sobre gpt2-chatbot llegaron a X, algunos han especulado inevitablemente con que se trata de una prueba de GPT-4.5, GPT-5 o incluso AGI. Sin embargo, la mayoría no está segura de que represente un avance concreto respecto a los modelos actuales.
En general, no hay forma de que una empresa de IA entrene a un chatbot completamente nuevo como este y lo lance de esa manera. Es casi seguro que es una variante de GPT-4.
En última instancia, son rumores hasta que el creador sale de detrás de las cortinas y reclama su propiedad.