Ny forskning har visat att programvara för AI-detektering kan vara partisk mot personer som inte har engelska som modersmål.
Den studie föreslog att över hälften av alla uppsatser på engelska som inte är modersmål och som skrivits av människor felaktigt flaggas som AI-genererade. Konsekvenserna av sådana falska positiva resultat är betydande, särskilt för studenter och arbetssökande.
I studien testades sju allmänt använda AI-textdetektorer på artiklar skrivna av personer som inte har engelska som modersmål. Resultaten visade på en hög andel falska positiva resultat, där dessa artiklar felaktigt klassificerades som AI-genererade.
James Zou, biträdande professor i biomedicinsk datavetenskap vid Stanford University, ledde teamet som körde 91 uppsatser skrivna av personer som inte har engelska som modersmål genom sju populära GPT-detektorer.
Dessa uppsatser, skrivna för det globalt erkända TOEFL-testet (Test of English as a Foreign Language), hade mer än hälften felaktigt flaggats som AI-genererade. I ett fall flaggade ett program till och med 98% av uppsatserna som AI-skapade.
När programvaran däremot analyserade uppsatser skrivna av engelsktalande åttondeklassare från USA identifierades över 90% korrekt som mänskligt genererade.
AI-detektorer har ofta kritiserats för att straffa individer med falska positiva resultat, även om vissa är betydligt värre än andra.
En av de viktigaste slutsatserna i studien är att AI-detektorer ofta har svårt att korrekt tolka uttryck som används av personer som inte har engelska som modersmål.
Dessa system har i första hand tränats på data från personer med engelska som modersmål, vilket har lett till att de har stämplat vissa fraser eller strukturer som felaktiga bara för att de avviker från vad som anses vara modersmålets språkbruk.
Personer som inte har engelska som modersmål kan utsättas för diskriminering
Konsekvenserna av detta är långtgående. Personer som inte har engelska som modersmål kan ställas inför utmaningar när de skickar in arbeten via utbildningsinstitutionernas automatiserade betygsplattformar.
Dessutom kan diskriminerande algoritmer orättvist straffa studenter vars första språk inte är engelska, vilket vidmakthåller social ojämlikhet i klassrummet.
Författarna drar slutsatsen: "Vi varnar starkt för användning av GPT-detektorer i utvärderings- eller utbildningssammanhang, särskilt vid bedömning av arbeten som utförts av personer som inte har engelska som modersmål."
Men varför hindras AI-detekteringsalgoritmer av text som inte är på modersmålsengelska?
AI-detektorer förlitar sig på "textperplexitet", ett mått på hur förutsägbart en generativ språkmodell kan förutse nästa ord i en mening. Låg perplexitet indikerar enkel förutsägelse, medan hög perplexitet återspeglar en mindre förutsägbar mening. Komplexa ord, fraser, liknelser, metaforer och idiom höjer poängen för perplexitet, vilket kan saknas hos skribenter som inte har engelska som modersmål.
AI:er tenderar att mata ut en mer förutsägbar sekvens av ord. Människor som använder vanliga ord i bekanta mönster riskerar alltså att deras arbete misstas för AI-producerad text.
Detta gäller naturligtvis inte bara texter som inte är skrivna på modersmålet utan även texter som är skrivna i en viss stil eller på en viss läsnivå. Till exempel riskerar en text som är utformad för att vara mycket lättläst att flaggas.
Ironiskt nog använde forskarna ChatGPT för att skriva om de flaggade TOEFL-uppsatserna med ett mer komplext språk efter att ha identifierat denna inbyggda partiskhet.
När de bearbetades igen genom AI-detektorerna märktes alla redigerade uppsatser som skrivna av människor. Detta resultat understryker en något paradoxal situation - dessa detektorer kan oavsiktligt uppmuntra författare med annat modersmål att använda AI mer för att undgå upptäckt.
Lärare förlitar sig på mer än AI-detektorer för att stävja plagiering. De genomför ytterligare skrivuppgifter i klassrummet, tittar djupare på referensanvändningar och deras noggrannhet och analyserar citat för att se om de är äkta.
Samtidigt håller utbildningsinstitutioner på att fastställa regler för användning och hantering av AI, däribland brittiska Russell Group of universities, som nyligen publicerade en gemensamt uttalande om AI.