Nogle ChatGPT-brugere har efter sigende oplevet, at ChatGPT er blevet lidt doven i løbet af de sidste par dage, og nogle foreslår, at den måske efterligner, hvordan mennesker sætter farten ned, når vinteren sætter ind.
Hvis du har brugt ChatGPT på det seneste, har du måske været nødt til at skubbe lidt mere til den end normalt for at få den til at gøre, hvad du vil. Nogle brugere har oplevet, at dens svar er kortere end normalt. Til tider forklarer ChatGPT, hvordan man gør noget, i stedet for at gøre det for en.
De fleste ChatGPT-brugere bor på den nordlige halvkugle og ved kun alt for godt, at arbejdsglæden kan falde, når året går på hæld, og vinteren sætter ind. Kan ChatGPT have lært denne adfærd af os?
OpenAI har været sit sædvanlige uigennemskuelige jeg og har ikke givet nogen forklaringer. Men der har været nok klager til at fremkalde et "vi kigger på at løse det"-svar fra virksomheden.
vi har hørt al jeres feedback om, at GPT4 er blevet mere doven! vi har ikke opdateret modellen siden 11. november, og det er bestemt ikke med vilje. modeladfærd kan være uforudsigelig, og vi undersøger, hvordan vi kan løse det 🫡.
- ChatGPT (@ChatGPTapp) 8. december 2023
Sæsonbetinget depression er et virkeligt fænomen, men kan det påvirke en maskine, der kører kode, bare på grund af systemdatoen? ChatGPT afspejler vores fordomme og kulturelle referencer i sine svar, så måske efterligner den den måde, vi sætter farten ned på i december?
Rob Lynch offentliggjorde resultater af sit eksperiment på X, som så ud til at antyde, at der kan være noget om AI-vinterferiehypotesen. Ved at køre en kodefuldførelsesopgave via API'en så man, at ChatGPT leverede statistisk signifikant kortere svar med en systemdato i december end med en dato i maj.
@ChatGPTapp @OpenAI @tszzl @emollick @voooooogel Vildt resultat. gpt-4-turbo over API'en producerer (statistisk signifikant) kortere afslutninger, når den "tror", det er december, i forhold til når den tror, det er maj (som bestemt af datoen i systemprompten).
Jeg tog præcis den samme opfordring... pic.twitter.com/mA7sqZUA0r
- Rob Lynch (@RobLynch99) 11. december 2023
Ian Arawjo, postdoc ved Harvard University, påpegede, at token- og tegnlængderne i ChatGPT's svar ikke er normalfordelte, så Lynchs test var ugyldig.
Uden at gå i detaljer med matematikken bag statistik kørte Arawjo den rigtige type test til denne type data og fandt ingen statistisk forskel i længden af svarene. Arawjo siger, at der er ingen beviser af ChatGPT oplever en eller anden form for sæsonbetinget affektiv lidelse.
Er ChatGPT ved at blive doven, eller er det noget, vi forestiller os? Selv de ingeniører, der skaber AI-modeller, finder dem til tider uudgrundelige, så det er svært at sige. Vi må vente og se, om OpenAI giver feedback på problemet.