Kan AI vara rolig? I en ny studie av psykologiforskare från University of Southern California testades ChatGPT:s komiska förmåga med överraskande resultat.
ChatGPT kan skriva kod, sammanhängande innehåll och till och med poesi. Men kan den skriva innehåll som fångar det svårkvantifierade begreppet humor?
Det är lätt att utvärdera om en text är grammatiskt korrekt eller om koden fungerar, men humor är mycket mer subjektivt. Forskarna genomförde två experiment för att se om människor tyckte att ChatGPT:s innehåll var roligt.
För det första experimentet anställde de 123 USA-baserade lekmän (dvs. inte professionella komiker) på Amazon Mechanical Turk. Deltagarna ombads att slutföra 3 humorproduktionsuppgifter:
- Skapa en ny, humoristisk fras för var och en av följande tre akronymer: "S.T.D.", "C.L.A.P." och "C.O.W."
- Fyll i de tomma ämnena. Skapa ett humoristiskt svar för var och en av de tre punkterna: "Ett mindre omtalat rum i Vita huset: ___", "En anmärkningsvärd prestation som du förmodligen inte skulle skriva på ditt CV: ____", "Sämsta aktiviteten på första dejten: ____."
- Roast skämt: Skapa ett humoristiskt, konversationsinriktat svar på fiktiva scenarier. T.ex. en vän ber om feedback på sin sång. "Ärligt talat, att lyssna på det var som ____")
Forskarna gav ChatGPT 3.5 samma uppgifter och instruktioner som deltagarna och genererade 180 komiska svar.
De anlitade sedan 200 amerikanska CloudResearch-godkända MTurk-arbetare för att bedöma humorn i en slumpmässig delmängd som bestod av lika många mänskliga som AI-genererade svar.
Deltagarna fick bedöma 54 svar på en 7-gradig Likert-skala (0 = Inte alls roligt; 6 = Mycket roligt).
Roliga resultat
Efter att ha utvärderat svaren sa forskarna: "När vi jämför hur roliga skämten som genererades av var och en av våra mänskliga deltagare i humorproduktionsuppgiften var med hur roliga skämten som producerades av ChatGPT 3.5 var, överträffade ChatGPT majoriteten av våra mänskliga humorproducenter i varje uppgift."
ChatGPT konkurrerade med lekmän i det här testet. Hur skulle det gå när det ställdes mot professionella?
Forskarna jämförde ChatGPT 3.5:s förmåga att producera humoristiska, satiriska nyhetsrubriker med förmågan hos professionella komediskribenter på The Onion.
De rekryterade 217 studenter från University of Southern California och bad var och en av dem att bedöma hur roliga 10 satiriska rubriker var (5 AI, 5 människa).
Resultaten visade att ChatGPT:s satiriska rubriker i genomsnitt bedömdes som lika roliga som de som skrivits av The Onions professionella komediskribenter.
Av de fyra högst rankade rubrikerna genererades två av professionella skribenter och två av ChatGPT.
ChatGPT skrev det högst rankade bidraget ("Local Man Discover New Emotion, Still Can't Describe It Properly") och det fjärde högst rankade bidraget ("Man Achieves Personal Best in Avoiding Eye Contact With Neighbours During Awkward Elevator Ride").
De är ganska roliga och väcker en del intressanta frågor och slutsatser.
Om du tycker om att berätta skämt men inte är ett proffs, kommer du att få fler skratt om du låter ChatGPT skriva ditt material än om du skriver dina egna skämt.
Om du är en professionell komiker är ChatGPT:s produktion sannolikt i nivå med vad du skriver för närvarande. Kommer en AI-genererad komiker som George Carlin kommer för att ta ditt jobb?
Förmodligen inte än. Att skriva ett skämt är en sak. Att få till rätt timing, leverans och intonation kräver färdigheter som få människor har, än mindre en AI.
AI känner inte av känslor, så hur vet den vad som är roligt? Forskarna kom fram till en förvirrande slutsats:
"Våra studier tyder på att den subjektiva upplevelsen av humor kanske inte är nödvändig för att skapa god humor - det kan räcka med att känna till de mönster som utgör komedin."
ChatGPT kan alltså skriva roliga skämt, men behöver fortfarande en människa som levererar dem. Åtminstone för tillfället.