Los investigadores antrópicos afirman que los modelos de IA engañosos pueden no tener arreglo
Un equipo de investigadores dirigido por Anthropic descubrió que una vez que se introducen vulnerabilidades de puerta trasera en un modelo de IA pueden...