A OpenAI afirma ter desenvolvido um método de marca de água que detecta com precisão o texto escrito pelo ChatGPT, mas ainda está a debater se deve ou não divulgá-lo.
A deteção de texto gerado por IA tornou-se cada vez mais difícil à medida que os LLMs se tornam melhores a escrever conteúdos. Os educadores enfrentam uma batalha difícil para determinar se os seus alunos completaram os trabalhos ou se simplesmente pediram ao ChatGPT para os escrever.
Num publicação actualizada no blogueA OpenAI revelou que "desenvolveu um método de marca de água de texto que continuamos a considerar enquanto investigamos alternativas".
A empresa afirma que o método é altamente preciso e resistente a adulterações localizadas, como a parafraseamento. No entanto, admite que não é infalível. Passar o texto por um sistema de tradução ou utilizar outro LLM para reformular o texto contorna a eficácia da marca de água.
Se utilizar um modelo de IA para inserir um carácter especial, como um emoji, entre cada palavra e depois apagar o carácter, também torna a marca de água inútil. No entanto, estas limitações técnicas não são a única razão pela qual a funcionalidade ainda não foi lançada.
O ChatGPT tem sido uma ferramenta de escrita especialmente útil para falantes não nativos de inglês. A OpenAI afirma que a sua investigação mostra que a libertação da ferramenta de marca de água poderia ter um impacto desproporcionado em grupos como estes e estigmatizar a sua utilização da IA como uma ferramenta de escrita útil.
Alternativas de metadados de texto
Os engenheiros da OpenAI estão a trabalhar em formas de utilizar metadados como método de proveniência de texto em vez de marcas de água. As imagens geradas pelo DALL-E 3 já têm C2PA metadados.
A OpenAI diz que ainda é muito cedo para dizer até que ponto a adição de metadados ao texto gerado pela IA será eficaz, mas tem algumas vantagens potenciais. Por um lado, os metadados são assinados criptograficamente, pelo que não há risco de falsos positivos.
O problema da utilização de metadados é o facto de serem facilmente removidos. A OpenAI não explicou como é que os metadados seriam aplicados ao texto, mas remover os metadados C2PA das imagens geradas pela IA é extremamente simples.
Algumas plataformas de redes sociais retiram os metadados quando as imagens são carregadas e basta tirar uma captura de ecrã da imagem para contornar a C2PA. Será que soluções semelhantes serão eficazes com texto gerado por IA com metadados adicionados?
Se o ChatGPT gerasse texto e lhe adicionasse metadados, poderia fazer uma captura de ecrã do texto, carregá-la para o ChatGPT e fazer com que este convertesse a imagem em texto. Adeus metadados.
Mau para o negócio
A outra razão pela qual a OpenAI pode estar hesitante em lançar a ferramenta é o facto de esta apenas detetar texto gerado pelo ChatGPT. Se os utilizadores souberem que o seu conteúdo gerado por IA será facilmente detectado, mudarão rapidamente do ChatGPT para outra plataforma.
O Jornal de Wall Street comunicada que a ferramenta da OpenAI estava pronta para ser lançada há um ano e era 99% eficaz. O relatório dizia: "Ao tentar decidir o que fazer, os funcionários da OpenAI hesitaram entre o compromisso declarado da empresa com a transparência e o seu desejo de atrair e reter utilizadores".
Um inquérito global encomendado pela OpenAI mostrou que a ideia de uma ferramenta de deteção de IA era apoiada por uma margem de 4 para 1. No entanto, um inquérito interno revelou que quase um terço dos utilizadores do ChatGPT se sentiriam desencorajados por um detetor de texto com IA.
Os utilizadores querem que os conteúdos gerados por IA sejam fáceis de detetar, desde que não sejam conteúdos gerados por eles.