Некоторые пользователи ChatGPT обнаружили, что в последние несколько дней ChatGPT стал немного ленивым, и некоторые предположили, что это может быть имитацией того, как люди замедляют темп работы с наступлением зимы.
Если вы пользовались ChatGPT в последнее время, вам, возможно, пришлось поднапрячься, чтобы заставить его сделать то, что вы хотите. Некоторые пользователи считают, что его ответы короче, чем обычно. Иногда ChatGPT объясняет, как сделать что-то, вместо того чтобы сделать это за вас.
Большинство пользователей ChatGPT живут в северном полушарии и прекрасно знают, что по мере того, как год заканчивается и наступает зима, энтузиазм к работе может ослабевать. Может быть, ChatGPT научился этому поведению у нас?
OpenAI, как обычно, была непрозрачна и не предложила никаких объяснений. Но жалоб было достаточно, чтобы компания ответила: "Мы рассматриваем возможность исправления".
Мы слышали все ваши отзывы о том, что GPT4 стал более ленивым! Мы не обновляли модель с 11 ноября, и это, конечно, не намеренно. Поведение модели может быть непредсказуемым, и мы пытаемся это исправить 🫡.
- ChatGPT (@ChatGPTapp) 8 декабря 2023 года
Сезонное аффективное расстройство - реальное явление, но может ли оно повлиять на машину, выполняющую код только из-за системной даты? ChatGPT отражает в своих ответах наши предубеждения и культурные особенности, так может ли он имитировать то, как мы замедляемся в декабре?
Роб Линч опубликовал результаты своего эксперимента на сайте X, которые, похоже, позволяют предположить, что в гипотезе о зимних каникулах ИИ что-то есть. Запустив задачу по завершению кода через API, он увидел, что ChatGPT дает статистически значимо более короткие ответы, если в системе стоит декабрьская дата, чем майская.
@ChatGPTapp @OpenAI @tszzl @emollick @voooooogel Дикий результат. gpt-4-turbo через API производит (статистически значимо) более короткие завершения, когда он "думает", что это декабрь, по сравнению с тем, когда он думает, что это май (как определено по дате в подсказке системы).
Я воспользовался точно такой же подсказкой... pic.twitter.com/mA7sqZUA0r
- Роб Линч (@RobLynch99) 11 декабря 2023 года
Ян Арауджо (Ian Arawjo), аспирант Гарвардского университета, отметил, что длина токенов и символов в ответах ChatGPT не является нормально распределенной, поэтому тест Линча не работает.
Не вдаваясь в подробности статистики, Arawjo провела правильный тест для таких данных и не обнаружила статистической разницы в длине ответов. Аравджо говорит, что нет доказательств ChatGPT испытывают ту или иную форму сезонного аффективного расстройства.
ChatGPT становится ленивым или нам это кажется? Даже инженеры, создающие модели ИИ, порой считают их непостижимыми, так что трудно сказать. Остается ждать, когда OpenAI предоставит обратную связь по этому вопросу.