El misterioso "gpt2-chatbot": ¿un sorprendente avance en IA?

29 de abril de 2024

  • Un chatbot no identificado, "gpt2-chatbot", apareció en el LMSys Chatbot Arena
  • Los probadores dicen que rivaliza o supera notablemente a GPT-4 y Claude 3 Opus
  • Nadie sabe de dónde ha salido, aunque parece ser una creación de OpenAI
GPT-2

Un misterioso chatbot llamado "gpt2-chatbot" ha suscitado gran expectación y especulación en la comunidad de la IA.

Este chatbot, que puedes encontrar y experimentar por ti mismo en el LMSys Chatbot Arenaes considerado por algunos usuarios más avanzado que los modelos actuales de última generación, como GPT-4 y Claude 3 Opus.

Surgido aparentemente de la nada, sus orígenes son totalmente desconocidos. ¿Podría tratarse de un proyecto experimental de un importante laboratorio de inteligencia artificial o de una extraña filtración? 

Los usuarios de Reddit piensan principalmente que es de OpenAI ya que el modelo admite que el estilo y el tono de la respuesta parecen diferentes de GPT-4 y GPT-4 Turbo, pero el corte de conocimientos difiere del disponible actualmente OpenAI modelos. 

Yo mismo le pregunté a gpt2-chatbot: "¿Quién eres?", a lo que me respondió:

"Fui creado por OpenAIuna organización de investigación que se centra en el desarrollo y la promoción de IA amigable en beneficio de la humanidad. Mi desarrollo se basa en la serie de modelos lingüísticos GPT (Generative Pre-trained Transformer), concretamente en la versión GPT-4, que es una evolución de modelos anteriores como el GPT-3. Estos modelos se entrenan con una amplia gama de textos de Internet, pero están diseñados para generar textos similares a los humanos basándose en las indicaciones que reciben.

OpenAI comenzó con el objetivo de garantizar que la inteligencia artificial general (IAG) beneficie a toda la humanidad. Llevan a cabo investigaciones en el campo de la IA con el objetivo de desarrollar y dirigir las tecnologías de inteligencia artificial de forma que beneficien a la humanidad en su conjunto, sin el lastre de las obligaciones financieras con los inversores.

Si tiene más preguntas sobre AI, OpenAIo tecnologías relacionadas, no dude en preguntar".

Cuando le pregunté por qué se llamaba gpt2-chatbot, me respondió:

"Para resumir, no me llamo "GPT-2"; soy una variante de GPT-4, diseñada específicamente para aplicaciones interactivas, como este formato conversacional. Mi diseño incluye mejoras en el manejo de los diálogos, características de seguridad, consideraciones éticas y calidad general de la respuesta. Si ve referencias a "GPT-2", es probable que estén hablando del modelo anterior a GPT-3 y GPT-4".

El rendimiento de gpt2-chatbot provoca especulaciones

En cuanto al rendimiento, un usuario del Foro de Y Combinator debatieron sobre los conocimientos del robot en ciencia de materiales y hablaron de la fabricación de álabes de turbina con una profundidad que no habrían visto de otro modo. 

Otro usuario, el conocido científico de datos Simon Wilson, quedó impresionado por su gestión de las consultas altamente personalizadas, lo que sugiere que tiene un conocimiento detallado de los antecedentes personales de la gente.

Otros señalaron las deficiencias habituales de los LLM, como alucinaciones e inexactitudes factuales.

Habiéndolo utilizado yo mismo, estoy de acuerdo en que parece una variante del GPT-4. 

En cuanto a si es mejor que la GPT-4, como algunos especulan, cabe destacar que muchos opinaban que el rendimiento de la GPT-4 disminuía con el tiempo (posiblemente coincidiendo con OpenAI dedicar recursos informáticos al entrenamiento de nuevos modelos).

Así pues, esta variante potencialmente no adulterada podría parecerse a GPT -4 cuando se lanzó por primera vez. Si a esto le añadimos una ligera diferenciación en el comportamiento y el rendimiento en tareas específicas, podemos entender por qué hay tanta especulación. 

Cuando las discusiones sobre gpt2-chatbot llegaron a X, algunos han especulado inevitablemente con que se trata de una prueba de GPT-4.5, GPT-5 o incluso AGI. Sin embargo, la mayoría no está segura de que represente un avance concreto respecto a los modelos actuales. 

En general, no hay forma de que una empresa de IA entrene a un chatbot completamente nuevo como este y lo lance de esa manera. Es casi seguro que es una variante de GPT-4.

En última instancia, son rumores hasta que el creador sale de detrás de las cortinas y reclama su propiedad.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales