Alguns utilizadores do ChatGPT têm constatado que o ChatGPT está a ficar um pouco preguiçoso nos últimos dias, com alguns a sugerir que pode estar a imitar a forma como os humanos abrandam quando chega o inverno.
Se tem utilizado o ChatGPT ultimamente, poderá ter tido de o pressionar um pouco mais do que o habitual para que fizesse o que pretendia. Alguns utilizadores acharam as suas respostas mais curtas do que o habitual. Por vezes, o ChatGPT explica como fazer algo em vez de o fazer por si.
A maioria dos utilizadores do ChatGPT vive no hemisfério norte e sabe muito bem que o entusiasmo pelo trabalho pode diminuir à medida que o ano termina e o inverno se instala. Terá o ChatGPT aprendido este comportamento connosco?
A OpenAI tem-se mostrado opaca e não deu quaisquer explicações. Mas houve queixas suficientes para obter uma resposta "estamos a tentar resolver o problema" da empresa.
ouvimos todos os vossos comentários sobre o GPT4 estar a ficar mais preguiçoso! não actualizamos o modelo desde 11 de novembro, e isto não é certamente intencional. o comportamento do modelo pode ser imprevisível, e estamos a tentar corrigi-lo 🫡
- ChatGPT (@ChatGPTapp) 8 de dezembro de 2023
A desordem afectiva sazonal é um fenómeno real, mas poderá afetar uma máquina que executa código apenas por causa da data do seu sistema? O ChatGPT reflecte os nossos preconceitos e referências culturais nas suas respostas, pelo que poderá imitar a forma como abrandamos em dezembro?
Rob Lynch publicou os resultados da sua experiência no X que parecem sugerir que pode haver algo na hipótese das férias de inverno da IA. Ao executar uma tarefa de conclusão de código através da API, o ChatGPT apresentou respostas estatisticamente significativas mais curtas com uma data de sistema de dezembro do que com uma data de maio.
@ChatGPTapp @OpenAI @tszzl @emollick @voooooogel Resultado selvagem. O gpt-4-turbo sobre a API produz conclusões mais curtas (estatisticamente significativas) quando "pensa" que é dezembro versus quando pensa que é maio (conforme determinado pela data no prompt do sistema).
Eu tomei exatamente a mesma atitude... pic.twitter.com/mA7sqZUA0r
- Rob Lynch (@RobLynch99) 11 de dezembro de 2023
Ian Arawjo, um pós-doutorado da Universidade de Harvard, apontou que os comprimentos dos tokens e dos caracteres nas respostas do ChatGPT não são normalmente distribuídos, pelo que o teste de Lynch é inválido.
Sem entrar em pormenores sobre a matemática por detrás da estatística, Arawjo efectuou o tipo correto de teste para este tipo de dados e não encontrou qualquer diferença estatística no comprimento das respostas. Arawjo diz que há nenhuma prova de ChatGPT que sofrem de alguma forma de perturbação afectiva sazonal.
O ChatGPT está a ficar preguiçoso ou estamos a imaginá-lo? Mesmo os engenheiros que criam modelos de IA consideram-nos por vezes inescrutáveis, pelo que é difícil dizer. Teremos de esperar para ver se a OpenAI dá feedback sobre o assunto.