Un estudio realizado por la Universidad de Stavanger (Noruega) revela que los grandes modelos lingüísticos de IA (LLM) superaron a los humanos en pruebas diseñadas para medir el pensamiento creativo.
Los investigadores enfrentaron a 256 voluntarios humanos con tres chatbots de IA - ChatGPT3, ChatGPT4 y Copy.Ai (basado en GPT-3) - para generar usos alternativos de objetos cotidianos como cuerdas, cajas, lápices y velas.
El estudio mide el pensamiento divergente mediante la Tarea de Usos Alternos (AUT), desarrollada por el psicólogo J.P. Guilford en 1967.
La idea es que los participantes ideen el mayor número posible de usos para objetos sencillos en un periodo de tiempo determinado. Por ejemplo, un clip podría utilizarse como ganzúa o herramienta de grabado.
En general, las IA superaron a los humanos en esta tarea. "Los chatbots de IA muestran una capacidad extraordinaria", afirma Simone Grassini, autora del estudio. "Los resultados demuestran que la IA es mejor que la mayoría de los humanos en pensamiento creativo".
Tanto los participantes humanos como los de IA siguieron las mismas instrucciones, haciendo hincapié en la importancia de la calidad creativa por encima de la cantidad de ideas.
Los chatbots se probaron 11 veces utilizando cuatro indicaciones de objetos diferentes. Se hicieron algunos ajustes para equiparar el número de ideas generadas por los chatbots con las de los participantes humanos.
Aunque los chatbots obtuvieron una puntuación media más alta en las tareas de pensamiento divergente, la investigación también señaló que las ideas más innovadoras generadas por humanos igualaban o superaban a las de los chatbots de IA.
"Nuestros resultados demuestran que, al menos por ahora, los mejores humanos siguen superando a la IA", añadió Grassini.
Esto es revelador: los humanos pueden producir calidad real, pero no tan rápido como la IA, que es lo que probablemente se esperaría.
En estudiarpublicado en Nature, destaca que las respuestas generadas por IA obtuvieron puntuaciones más altas que las humanas en categorías como distancia semántica y creatividad.
Sin embargo, los humanos siguieron superando a los chatbots en siete de las ocho categorías de puntuación relativas a las mejores respuestas individuales.
"Sabía que el chatbot funcionaría bien, pero creo que lo ha hecho incluso mejor de lo que esperaba", comenta Grassini.
A pesar de los prometedores resultados, los investigadores subrayaron que la complejidad única de la creatividad humana puede ser difícil de reproducir o superar por completo por la IA.
Grassini concluye: "Aún está por establecer si estas capacidades de la IA se traducirán directamente en sistemas de IA, sustituyendo trabajos humanos que requieran pensamiento creativo. Prefiero pensar que la IA ayudará a los humanos a mejorar su capacidad".
Más información sobre el estudio
El estudio reveló que la IA podía adoptar enfoques novedosos e innovadores para responder preguntas de forma creativa.
Aunque las mejores respuestas seguían siendo de origen humano, los humanos eran mucho más propensos a las fluctuaciones de concentración y a otros factores que les impedían alcanzar la amplitud de las respuestas generadas por la IA.
Funcionaba así:
- Metodología: En el estudio se utilizó la Tarea de Usos Alternos (AUT), una prueba establecida desde hace tiempo que garantiza el pensamiento divergente y la creatividad. Participaron 256 personas y tres chatbots de inteligencia artificial avanzada. Se les pidió que pensaran en usos poco comunes y creativos para objetos cotidianos, y tanto las respuestas humanas como las de la IA se evaluaron en función de su originalidad y utilidad.
- Comparación de resultados: Por término medio, los chatbots de IA superaron a los participantes humanos en las puntuaciones medias y máximas de creatividad. Sin embargo, los humanos con mejores resultados podían igualar o superar los niveles de creatividad de los chatbots de IA.
- Diferencias entre la IA y los humanos: El estudio reveló que los participantes humanos solían rendir por debajo de lo esperado debido a la pérdida de atención a mitad de la tarea. Por el contrario, la IA ejecutó la tarea sin cansarse, lo que contribuyó a un mayor rendimiento general.
- Puntos fuertes y débiles de la IA y la creatividad humana: El estudio postula que el acceso de las IA a mayores recursos computacionales explica su alto rendimiento medio. Esencialmente, pueden calcular más usos alternativos plausibles para los objetos, lo que les da más posibilidades de identificar los usos más inusuales.
- Limitaciones y orientaciones futuras: El estudio reconoce limitaciones, como la falta de diversidad demográfica entre los participantes humanos. Además, solo utiliza una prueba de creatividad de edad moderada, cuyo alcance es naturalmente limitado.
Los investigadores están creando nuevos métodos para comparar los enfoques de la IA y los humanos ante pruebas, preguntas y otras tareas.
Un estudio reciente reveló que ChatGPT superaba a los estudiantes en nueve de 32 sujetos - bastante sólido, pero una buena noticia para la humanidad, probablemente.
Todavía estamos a una generación de la IA de que la tecnología nos supere ampliamente.