Ny forskning tyder på att ChatGPT kan prestera bättre än elever inom specifika ämnesområden, lura lärare i processen och undvika AI-detektorer.
En studie ledd av Yasir Zaki vid New York University Abu Dhabi visade att ChatGPT:s svar motsvarade eller överträffade kvaliteten på studenternas svar i nio av 32 ämnen.
Framför allt fick chatboten nästan dubbelt så höga poäng som den genomsnittliga studenten i en kurs som heter Introduction to Public Policy.
Det fanns dock brister i AI:s rustning, eftersom ChatGPT kämpade med uppgifter som krävde "kritisk analys". Och låt oss inte glömma att mänskliga studenter i allmänhet dominerade förfarandet.
Trots detta minskar klyftan mellan AI-genererat och mänskligt arbete, vilket kan få dramatiska konsekvenser för utbildningssektorn och mänskliga kunskapssystem som helhet
Intressant nog var ChatGPT ganska dålig på uppgifter som krävde färdigheter eller kunskaper i programmering och datavetenskap, men utmärkte sig inom social forskning, politik och teknik.
De 32 ämnena omfattade ämnen som datavetenskap, matematik, sociologi, psykologi, statsvetenskap och företagsekonomi. I studien tillfrågades dessutom studenter och lärare från fem länder - Brasilien, Indien, Japan, Storbritannien och USA - om deras syn på hur tekniken används i undervisningen.
"De här bedömarna fick inte veta varifrån svaren kom och de var inte heller medvetna om syftet med bedömningen", säger Zaki.
"ChatGPT presterade mycket bättre på frågor som krävde att man mindes information, men sämre på frågor som krävde kritisk analys", säger Zaki.
Vidare fann forskarna att AI-detekteringstjänsterna har svårt att skilja mellan mänskliga och AI-genererade svar med en framgångsgrad på 95%.
Undersökningen av studenters och lärares inställning till AI i undervisningen visade på en polarisering kring huruvida användningen av AI utgör plagiering eller inte.
Thomas Lancaster från Imperial College i London kommenterade studiens konsekvenser. Enligt honom avslöjar resultaten brister i den nuvarande metoden för utvärderingar på universitet. "Om [bättre svar] är möjliga [med ChatGPT] tyder det på att det finns brister i bedömningsdesignen."
Viktiga resultat
Denna mångfacetterade studie undersökte ChatGPT:s prestanda och samlade in ytterligare information om kvalitativa åsikter om tekniken.
Här är de viktigaste resultaten:
- Akademisk prestation: ChatGPT:s resultat var jämförbara med eller bättre än universitetsstudenternas i 9 av 32 kurser inom åtta olika ämnesområden.
- Algoritmer för detektering saknas: Nuvarande algoritmer, inklusive GPTZero, som är utformade för att upptäcka ChatGPT-genererad text, är i stort sett ineffektiva. Dessa algoritmer felklassificerar inte bara mänskliga svar som AI-genererade utan misslyckas också med att korrekt identifiera ChatGPT-genererat innehåll som sådant.
- Student- och lärarperspektiv: Det finns en uppenbar skillnad mellan studenter och lärare när det gäller de etiska konsekvenserna av att använda ChatGPT. En överväldigande majoritet av studenterna avser att använda verktyget för skolarbete, medan lärarna är benägna att betrakta användningen som plagiat.
- Globala perspektiv: Undersökta studenter och lärare från fem länder (Brasilien, Indien, Japan, Storbritannien och USA) visade varierande åsikter om den etiska användningen av ChatGPT. Till exempel anser studenter i Indien att det är oetiskt att använda ChatGPT för läxor, medan studenter i Brasilien anser att det är etiskt. Men 94% av studenterna i båda länderna har för avsikt att använda ChatGPT för akademiska ändamål.
AI:s roll inom utbildning har utvecklats till en virvlande debatt, där studenterna kanske är bäst lämpade att utnyttja tekniken medan lärarna uppdaterar sin förståelse.
Detta har lett till en del pinsamma situationer, som när en professor vid Texas A&M vägrade att markera sina klassuppsatser eftersom han trodde att de var AI-genererade.
En sak är säker: AI kommer att bli en allt viktigare del av utbildningen, både positivt och negativt.