Undersøgelse viser, at ChatGPT er på niveau med eller overgår studerende i ni ud af 32 fag

Ny forskning tyder på, at ChatGPT kan udkonkurrere elever i specifikke fagområder, narre lærere i processen og undgå AI-detektorer.

En undersøgelse ledet af Yasir Zaki ved New York University Abu Dhabi viste, at ChatGPT's svar svarede til eller overgik kvaliteten af de studerendes svar i ni ud af 32 fag.

Især scorede chatbotten næsten dobbelt så højt som den gennemsnitlige studerende i et kursus kaldet Introduction to Public Policy.

Der var dog huller i AI'ens rustning, da ChatGPT kæmpede med opgaver, der krævede "kritisk analyse". Og lad os ikke glemme, at menneskelige studerende generelt dominerede.

Alligevel mindskes kløften mellem AI-genereret og menneskeligt arbejde, hvilket har potentielt dramatiske konsekvenser for uddannelsessektoren og menneskelige videnssystemer som helhed.

Interessant nok var ChatGPT ret dårlig til opgaver, der krævede færdigheder eller viden om programmering og datalogi, men udmærkede sig inden for samfundsforskning, politik og teknik.

ChatGPT udmærkede sig inden for ingeniørrelaterede emner, repræsenteret ved de grønne markeringer her. Kilde: Naturen.

De 32 fag dækkede emner som datalogi, matematik, sociologi, psykologi, statskundskab og erhvervsliv. Derudover undersøgte undersøgelsen studerende og undervisere fra fem lande - Brasilien, Indien, Japan, Storbritannien og USA - for at måle deres perspektiver på teknologiens brug i undervisningen.

"Disse bedømmere blev ikke gjort opmærksomme på kilderne til disse svar, og de var heller ikke klar over formålet med bedømmelsen", siger Zaki.

"ChatGPT klarede sig meget bedre på spørgsmål, der krævede genkaldelse af information, men klarede sig dårligt på spørgsmål, der krævede kritisk analyse", siger Zaki.

Desuden fandt forskerne ud af, at AI-detekteringstjenester dårligt kan skelne mellem menneskelige og AI-genererede svar med en succesrate på 95%.

Undersøgelsen af de studerendes og undervisernes holdning til kunstig intelligens i undervisningen afslørede en polarisering i forhold til, om brugen af kunstig intelligens udgør plagiat eller ej.

Thomas Lancaster fra Imperial College London udtalte sig om undersøgelsens konsekvenser. Ifølge ham afslører resultaterne fejl i den nuværende tilgang til universitetsevalueringer. "Hvis [bedre svar] er mulige [med ChatGPT], tyder det på, at der er fejl i vurderingsdesignet."

Vigtige resultater

Dette mangesidede studie undersøgte ChatGPT's ydeevne og indsamlede yderligere oplysninger om kvalitative meninger om teknologien.

Her er de vigtigste resultater:

Akademisk præstation: ChatGPT's præstationer var sammenlignelige eller bedre end universitetsstuderendes i 9 ud af 32 kurser på tværs af otte discipliner.
Der mangler detektionsalgoritmer: Nuværende algoritmer, herunder GPTZero, der er designet til at opdage ChatGPT-genereret tekst, er stort set ineffektive. Disse algoritmer fejlklassificerer ikke kun menneskelige svar som AI-genererede, men identificerer heller ikke korrekt ChatGPT-genereret indhold som sådan.
Elevernes og lærernes synspunkter: Der er en tilsyneladende uoverensstemmelse mellem studerende og undervisere om de etiske konsekvenser af at bruge ChatGPT. De studerende har overvejende til hensigt at bruge værktøjet til skolearbejde, mens underviserne er tilbøjelige til at behandle brugen af det som plagiat.
Globale perspektiver: Undersøgte studerende og undervisere fra fem lande (Brasilien, Indien, Japan, Storbritannien og USA) viste forskellige meninger om den etiske brug af ChatGPT. For eksempel mener studerende i Indien, at det er uetisk at bruge det til lektier, mens studerende i Brasilien mener, at det er etisk forsvarligt. Men 94% af de studerende i begge lande har til hensigt at bruge ChatGPT til akademiske formål.

AI's rolle i uddannelse har udviklet sig til en hvirvlende debat, hvor de studerende måske har de bedste forudsætninger for at udnytte teknologien, mens underviserne opdaterer deres forståelse.

Det har ført til nogle pinlige situationer, som da en professor fra Texas A&M nægtede at markere sine klasseopgaver, da han mente, at de var AI-genererede.

En ting er sikkert: AI vil blive mere fast forankret i uddannelse, til gavn eller ulempe.

Undersøgelse viser, at ChatGPT er lige så god eller bedre end eleverne i ni ud af 32 fag

Vigtige resultater

Deltag i fremtiden

Sam Jeans

RELATEREDE ARTIKLER

ChatGPT Is Making People Think They’re Gods and Their Families Are Terrified

China Unveils World’s First AI Hospital: 14 Virtual Doctors Ready to Treat Thousands Daily

Katy Perry Didn’t Attend the Met Gala, But AI Made Her the Star of the Night

Therapists Too Expensive? Why Thousands of Women Are Spilling Their Deepest Secrets to ChatGPT

Undersøgelse viser, at ChatGPT er lige så god eller bedre end eleverne i ni ud af 32 fag

Vigtige resultater

Deltag i fremtiden

Sam Jeans

RELATEREDE ARTIKLER

ChatGPT Is Making People Think They’re Gods and Their Families Are Terrified

China Unveils World’s First AI Hospital: 14 Virtual Doctors Ready to Treat Thousands Daily

Katy Perry Didn’t Attend the Met Gala, But AI Made Her the Star of the Night

Therapists Too Expensive? Why Thousands of Women Are Spilling Their Deepest Secrets to ChatGPT

GRATIS PDF EKSKLUSIVTVær på forkant med DailyAI

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI