OpenAI afirma haber desarrollado un método de marca de agua que detecta con precisión el texto escrito por ChatGPT, pero aún está debatiendo si publicarlo o no.
Detectar texto generado por IA se ha convertido cada vez más difícil a medida que los LLM mejoran en la redacción de contenidos. Los educadores se enfrentan a una ardua batalla para determinar si sus alumnos han completado las tareas ellos mismos o simplemente se las han encargado a ChatGPT.
En un entrada de blog actualizada, OpenAI reveló que ha "desarrollado un método de marca de agua de texto que seguimos considerando mientras investigamos alternativas".
La empresa afirma que el método es muy preciso y resistente a manipulaciones localizadas como la paráfrasis. No obstante, admite que no es infalible. Si se pasa el texto por un sistema de traducción o se utiliza otro LLM para reformularlo, se evita la eficacia de la marca de agua.
Si utilizas un modelo de IA para insertar un carácter especial, como un emoji, entre cada palabra y luego lo eliminas, la marca de agua también queda inutilizada. Sin embargo, estas limitaciones técnicas no son la única razón por la que no ha lanzado la función.
ChatGPT ha sido una herramienta de escritura especialmente útil para los hablantes no nativos de inglés. OpenAI afirma que su investigación demuestra que la liberación de la herramienta de marca de agua podría afectar de forma desproporcionada a grupos como estos y estigmatizar su uso de la IA como herramienta de escritura útil.
Alternativas a los metadatos de texto
Los ingenieros de OpenAI están trabajando en formas de utilizar metadatos como método de procedencia del texto en lugar de marcas de agua. Las imágenes generadas por DALL-E 3 ya tienen C2PA metadatos.
OpenAI afirma que es demasiado pronto para saber hasta qué punto sería eficaz añadir metadatos al texto generado por la IA, pero tiene algunas ventajas potenciales. En primer lugar, los metadatos están firmados criptográficamente, por lo que no hay riesgo de falsos positivos.
El problema de utilizar metadatos es que se eliminan fácilmente. OpenAI no ha explicado cómo se aplicarían los metadatos al texto, pero eliminar los metadatos C2PA de las imágenes generadas por IA es extremadamente sencillo.
Algunas plataformas de redes sociales eliminan los metadatos cuando se suben imágenes, por lo que basta con hacer una captura de pantalla de la imagen para evitar la C2PA. Serán eficaces soluciones similares para el texto generado por IA con metadatos añadidos?
Si ChatGPT generara texto y le añadiera metadatos, podrías hacer una captura de pantalla del texto, subirla a ChatGPT y hacer que convirtiera la imagen en texto. Adiós a los metadatos.
Malo para los negocios
La otra razón por la que OpenAI puede dudar en lanzar la herramienta es que sólo detecta texto generado por ChatGPT. Si los usuarios saben que sus contenidos generados por IA serán fácilmente detectados, pasarán rápidamente de ChatGPT a otra plataforma.
El Wall Street Journal informó que la herramienta de OpenAI lleva un año lista para su lanzamiento y era 99% eficaz. El informe decía: "Al tratar de decidir qué hacer, los empleados de OpenAI han vacilado entre el compromiso declarado de la startup con la transparencia y su deseo de atraer y retener a los usuarios."
Una encuesta mundial encargada por OpenAI mostró que la idea de una herramienta de detección de IA era apoyada por un margen de 4 a 1. Sin embargo, una encuesta interna reveló que casi un tercio de los usuarios de ChatGPT se sentirían desanimados por un detector de texto con IA.
Los usuarios quieren que los contenidos generados por la IA sean fáciles de detectar, siempre que no sean contenidos que ellos hayan generado.