Los detectores de inteligencia artificial discriminan a los hablantes de inglés no nativos, según un estudio

10 de julio de 2023

Sesgo del detector AI

Una nueva investigación ha revelado un posible sesgo en contra de los hablantes de inglés no nativos en el software de detección de IA.

En estudiar sugiere que más de la mitad de las redacciones humanas en inglés no nativo se marcan erróneamente como generadas por IA. Las consecuencias de estos falsos positivos son importantes, sobre todo para estudiantes y solicitantes de empleo.

El estudio probó siete detectores de texto de IA ampliamente utilizados en artículos escritos por hablantes no nativos de inglés. Los resultados indicaron una elevada tasa de falsos positivos, ya que estos artículos se clasificaron erróneamente como generados por IA.

James Zou, profesor adjunto de ciencia de datos biomédicos de la Universidad de Stanford, dirigió el equipo que pasó 91 ensayos escritos por hablantes no nativos de inglés por siete conocidos detectores de GPT. 

Más de la mitad de estas redacciones, escritas para el mundialmente reconocido TOEFL (Test of English as a Foreign Language), se marcaron erróneamente como generadas por IA. En un caso, un programa llegó a marcar 98% de los ensayos como creados por IA. 

Por el contrario, cuando el software analizó ensayos escritos por alumnos nativos de habla inglesa de octavo curso de EE.UU., más de 90% se identificaron correctamente como generados por humanos.

Los detectores de IA han sido muy criticados por penalizar a las personas con falsos positivos, aunque algunos son considerablemente peores que otros. 

Una de las principales conclusiones del estudio es que los detectores de IA suelen tener problemas para interpretar con precisión las expresiones utilizadas por hablantes de inglés no nativos. 

Estos sistemas se han entrenado principalmente con datos de hablantes nativos de inglés, lo que les lleva a etiquetar ciertas frases o estructuras como incorrectas simplemente porque se desvían de lo que se considera el uso nativo de la lengua inglesa. 

Las personas cuya lengua materna no es el inglés pueden ser discriminadas

Las implicaciones de este hecho son de gran alcance. Los hablantes no nativos de inglés podrían enfrentarse a dificultades a la hora de enviar trabajos a través de plataformas de calificación automatizadas empleadas por los centros educativos.

Además, los algoritmos discriminatorios podrían penalizar injustamente a los alumnos cuya lengua materna no es el inglés, perpetuando la desigualdad social en el aula. 

Los autores concluyen: "Desaconsejamos encarecidamente el uso de detectores de GPT en contextos evaluativos o educativos, especialmente cuando se evalúa el trabajo de hablantes no nativos de inglés."

Pero, ¿por qué los algoritmos de detección de IA se ven frustrados por textos en inglés no nativo?

Los detectores de IA se basan en "perplejidad textual", una medida de la capacidad de predicción de un modelo lingüístico generativo para anticipar la siguiente palabra de una frase. Una perplejidad baja indica una predicción fácil, mientras que una perplejidad alta refleja una frase menos predecible. Las palabras complejas, las frases, los símiles, las metáforas y las expresiones idiomáticas aumentan la perplejidad, algo de lo que pueden carecer los escritores no nativos.

Las IA tienden a producir una secuencia de palabras más predecible. Así, los humanos que utilizan palabras comunes en patrones familiares corren el riesgo de que su trabajo se confunda con un texto producido por la IA.

Por supuesto, esto no sólo incluye el texto escrito en un idioma no nativo, sino también el texto escrito en un estilo o nivel de lectura específico. Por ejemplo, un texto diseñado para ser muy legible corre el riesgo de ser marcado. 

Irónicamente, tras identificar este sesgo inherente, los investigadores utilizaron ChatGPT para reescribir los ensayos TOEFL marcados utilizando un lenguaje más complejo. 

Una vez procesados de nuevo por los detectores de IA, todos los ensayos editados fueron calificados como escritos por humanos. Este resultado pone de manifiesto una situación un tanto paradójica: estos detectores podrían animar inadvertidamente a los escritores no nativos a utilizar más la IA para evitar ser detectados.

Los educadores recurren a algo más que detectores de IA para reprimir el plagio. Llevan a cabo tareas de redacción adicionales en el aula, profundizan en el uso de referencias y su exactitud y analizan la autenticidad de las citas.

Mientras tanto, los centros educativos están estableciendo normas para el uso y la gestión de la IA, entre ellos el Grupo Russell de universidades del Reino Unido, que recientemente publicó un declaración conjunta sobre la IA.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales