Обучение отказу от LLM легко обойти с помощью подсказок в прошедшем времени
Исследователи из Швейцарского федерального технологического института Лозанны (EPFL) обнаружили, что написание опасных подсказок в прошедшем времени позволяет обойти...