Модели искусственного интеллекта могут обманывать, лгать и играть с системой ради вознаграждения
Исследование, проведенное Anthropic и другими учеными, показало, что неправильно сформулированные цели обучения и терпимость к подхалимству могут привести к тому, что ИИ...