AI-detektorer diskriminerar personer som inte har engelska som modersmål, enligt studie

10 juli 2023

AI-detektorns bias

Ny forskning har visat att programvara för AI-detektering kan vara partisk mot personer som inte har engelska som modersmål.

Den studie föreslog att över hälften av alla uppsatser på engelska som inte är modersmål och som skrivits av människor felaktigt flaggas som AI-genererade. Konsekvenserna av sådana falska positiva resultat är betydande, särskilt för studenter och arbetssökande.

I studien testades sju allmänt använda AI-textdetektorer på artiklar skrivna av personer som inte har engelska som modersmål. Resultaten visade på en hög andel falska positiva resultat, där dessa artiklar felaktigt klassificerades som AI-genererade.

James Zou, biträdande professor i biomedicinsk datavetenskap vid Stanford University, ledde teamet som körde 91 uppsatser skrivna av personer som inte har engelska som modersmål genom sju populära GPT-detektorer. 

Dessa uppsatser, skrivna för det globalt erkända TOEFL-testet (Test of English as a Foreign Language), hade mer än hälften felaktigt flaggats som AI-genererade. I ett fall flaggade ett program till och med 98% av uppsatserna som AI-skapade. 

När programvaran däremot analyserade uppsatser skrivna av engelsktalande åttondeklassare från USA identifierades över 90% korrekt som mänskligt genererade.

AI-detektorer har ofta kritiserats för att straffa individer med falska positiva resultat, även om vissa är betydligt värre än andra. 

En av de viktigaste slutsatserna i studien är att AI-detektorer ofta har svårt att korrekt tolka uttryck som används av personer som inte har engelska som modersmål. 

Dessa system har i första hand tränats på data från personer med engelska som modersmål, vilket har lett till att de har stämplat vissa fraser eller strukturer som felaktiga bara för att de avviker från vad som anses vara modersmålets språkbruk. 

Personer som inte har engelska som modersmål kan utsättas för diskriminering

Konsekvenserna av detta är långtgående. Personer som inte har engelska som modersmål kan ställas inför utmaningar när de skickar in arbeten via utbildningsinstitutionernas automatiserade betygsplattformar.

Dessutom kan diskriminerande algoritmer orättvist straffa studenter vars första språk inte är engelska, vilket vidmakthåller social ojämlikhet i klassrummet. 

Författarna drar slutsatsen: "Vi varnar starkt för användning av GPT-detektorer i utvärderings- eller utbildningssammanhang, särskilt vid bedömning av arbeten som utförts av personer som inte har engelska som modersmål."

Men varför hindras AI-detekteringsalgoritmer av text som inte är på modersmålsengelska?

AI-detektorer förlitar sig på "textperplexitet", ett mått på hur förutsägbart en generativ språkmodell kan förutse nästa ord i en mening. Låg perplexitet indikerar enkel förutsägelse, medan hög perplexitet återspeglar en mindre förutsägbar mening. Komplexa ord, fraser, liknelser, metaforer och idiom höjer poängen för perplexitet, vilket kan saknas hos skribenter som inte har engelska som modersmål.

AI:er tenderar att mata ut en mer förutsägbar sekvens av ord. Människor som använder vanliga ord i bekanta mönster riskerar alltså att deras arbete misstas för AI-producerad text.

Detta gäller naturligtvis inte bara texter som inte är skrivna på modersmålet utan även texter som är skrivna i en viss stil eller på en viss läsnivå. Till exempel riskerar en text som är utformad för att vara mycket lättläst att flaggas. 

Ironiskt nog använde forskarna ChatGPT för att skriva om de flaggade TOEFL-uppsatserna med ett mer komplext språk efter att ha identifierat denna inbyggda partiskhet. 

När de bearbetades igen genom AI-detektorerna märktes alla redigerade uppsatser som skrivna av människor. Detta resultat understryker en något paradoxal situation - dessa detektorer kan oavsiktligt uppmuntra författare med annat modersmål att använda AI mer för att undgå upptäckt.

Lärare förlitar sig på mer än AI-detektorer för att stävja plagiering. De genomför ytterligare skrivuppgifter i klassrummet, tittar djupare på referensanvändningar och deras noggrannhet och analyserar citat för att se om de är äkta.

Samtidigt håller utbildningsinstitutioner på att fastställa regler för användning och hantering av AI, däribland brittiska Russell Group of universities, som nyligen publicerade en gemensamt uttalande om AI.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar