Ny forskning tyder på at ChatGPT kan prestere bedre enn elever i spesifikke fagområder, lure lærere i prosessen og unngå AI-detektorer.
En studie ledet av Yasir Zaki ved New York University Abu Dhabi viste at ChatGPTs svar var like gode eller bedre enn studentenes svar i ni av 32 fag.
Chatboten fikk nesten dobbelt så høy poengsum som gjennomsnittsstudenten i et kurs kalt Introduction to Public Policy.
Det var imidlertid noen svakheter ved AI, ettersom ChatGPT slet med oppgaver som krevde "kritisk analyse". Og la oss ikke glemme at de menneskelige studentene generelt dominerte.
Likevel blir gapet mellom AI-generert og menneskelig arbeid stadig mindre, noe som kan få dramatiske konsekvenser for utdanningssektoren og menneskelige kunnskapssystemer som helhet
Det er interessant å merke seg at ChatGPT var ganske dårlig i oppgaver som krevde ferdigheter eller kunnskaper innen programmering og informatikk, men utmerket seg i samfunnsforskning, politikk og ingeniørfag.
De 32 fagene dekket emner som informatikk, matematikk, sosiologi, psykologi, statsvitenskap og økonomi. I tillegg ble studenter og lærere fra fem land - Brasil, India, Japan, Storbritannia og USA - spurt om deres syn på bruken av teknologien i undervisningen.
"Disse sensorene ble ikke gjort oppmerksomme på kildene til disse svarene, og de var heller ikke klar over hensikten med karaktersettingen", sier Zaki.
"ChatGPT gjorde det mye bedre på spørsmål som krevde gjenkalling av informasjon, men presterte dårlig på spørsmål som krevde kritisk analyse, sier Zaki.
Forskerne fant også ut at AI-deteksjonstjenestene var dårlige til å skille mellom menneskelige og AI-genererte svar, med en suksessrate på 95%.
Undersøkelsen av studenters og læreres holdninger til kunstig intelligens i utdanningen avdekket en polarisering i synet på hvorvidt bruk av kunstig intelligens utgjør plagiat eller ikke.
Thomas Lancaster ved Imperial College London har uttalt seg om studiens implikasjoner. Ifølge ham avslører funnene mangler i den nåværende tilnærmingen til universitetsevalueringer. "Hvis [bedre svar] er mulig [med ChatGPT], tyder det på at det er feil i vurderingsdesignet."
Viktige funn
Denne flerfasetterte studien undersøkte ChatGPTs ytelse og samlet inn tilleggsinformasjon om kvalitative meninger om teknologien.
Her er de viktigste funnene:
- Akademiske prestasjoner: ChatGPTs prestasjoner var sammenlignbare eller bedre enn universitetsstudentenes i 9 av 32 kurs fordelt på åtte fagområder.
- Deteksjonsalgoritmer er mangelfulle: Dagens algoritmer, inkludert GPTZero, som er utviklet for å oppdage ChatGPT-generert tekst, er i stor grad ineffektive. Disse algoritmene feilklassifiserer ikke bare menneskelige svar som AI-genererte, men klarer heller ikke å identifisere ChatGPT-genererte tekster som slike.
- Studentenes og lærernes synspunkter: Det er en tilsynelatende uoverensstemmelse mellom studenter og lærere når det gjelder de etiske implikasjonene av å bruke ChatGPT. Studentene har i stor grad tenkt å bruke verktøyet til skolearbeid, mens lærerne er tilbøyelige til å behandle bruken som plagiat.
- Globale perspektiver: En spørreundersøkelse blant studenter og lærere fra fem land (Brasil, India, Japan, Storbritannia og USA) viste at det er ulike meninger om etisk bruk av ChatGPT. For eksempel mener studentene i India at det er uetisk å bruke ChatGPT til lekser, mens studentene i Brasil mener at det er etisk forsvarlig. Likevel har 94% av studentene i begge land til hensikt å bruke ChatGPT til akademiske formål.
AIs rolle i utdanning har utviklet seg til en virvlende debatt, der studentene kanskje har de beste forutsetningene for å utnytte teknologien, mens lærerne oppdaterer sin forståelse.
Dette har ført til noen pinlige situasjoner, som da en professor ved Texas A&M nektet å merke klasseoppgavene sine, ettersom han trodde de var AI-genererte.
Én ting er sikkert: Kunstig intelligens kommer til å bli en stadig viktigere del av utdanningen, enten det er positivt eller negativt.