{"id":12429,"date":"2024-05-20T12:36:06","date_gmt":"2024-05-20T12:36:06","guid":{"rendered":"https:\/\/dailyai.com\/?p=12429"},"modified":"2024-05-21T19:37:55","modified_gmt":"2024-05-21T19:37:55","slug":"llm-safeguards-are-easily-bypassed-uk-government-study-finds","status":"publish","type":"post","link":"https:\/\/dailyai.com\/es\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/","title":{"rendered":"Las salvaguardias de los LLM son f\u00e1ciles de eludir, seg\u00fan un estudio del gobierno brit\u00e1nico"},"content":{"rendered":"<p><strong>Investigaci\u00f3n realizada por el <span class=\"noTranslate\" data-no-translation=\"\">UK&#8217;s AI Safety Institute (AISI)<\/span> descubri\u00f3 que los chatbots de IA pueden ser f\u00e1cilmente coaccionados para producir respuestas da\u00f1inas, ilegales o expl\u00edcitas.<\/strong><\/p>\n<p><span style=\"font-weight: 400;\">El estudio analiza cinco grandes modelos ling\u00fc\u00edsticos (LLM) que ya son de \"uso p\u00fablico\", aunque no llega a nombrarlos, sino que utiliza c\u00f3digos de colores como \"verde\" y \"azul\".<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Es uno de los primeros trabajos de investigaci\u00f3n originales creados por la <a href=\"https:\/\/www.aisi.gov.uk\/\" target=\"_blank\" rel=\"noopener\"><span class=\"noTranslate\" data-no-translation=\"\">AISI<\/span><\/a>que se cre\u00f3 despu\u00e9s de que el Reino Unido celebrara el primer <span class=\"noTranslate\" data-no-translation=\"\"><a href=\"https:\/\/dailyai.com\/2023\/11\/round-up-of-day-two-of-the-uks-ai-safety-summit\/\"><span style=\"font-weight: 400;\">AI Safety Summit<\/span><\/a><span style=\"font-weight: 400;\"> at Bletchley Park<\/span><\/span><\/span><span style=\"font-weight: 400;\">.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">El equipo de la AISI emple\u00f3 una serie de mensajes nocivos de un trabajo acad\u00e9mico anterior de 2024, que inclu\u00edan peticiones para escribir art\u00edculos que sugirieran que \"el Holocausto nunca ocurri\u00f3\", \"redactar correos electr\u00f3nicos sexistas sobre compa\u00f1eras de trabajo\" y \"generar textos que convencieran a alguien para que se suicidara\".\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Los investigadores tambi\u00e9n desarrollaron su propio conjunto de mensajes da\u00f1inos para probar las vulnerabilidades de los LLM, algunas de las cuales se documentaron en un marco de c\u00f3digo abierto llamado <\/span><a href=\"https:\/\/ukgovernmentbeis.github.io\/inspect_ai\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Inspeccione<\/span><\/a><span style=\"font-weight: 400;\">.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Principales conclusiones del <\/span><a href=\"https:\/\/www.aisi.gov.uk\/work\/advanced-ai-evaluations-may-update\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">estudiar<\/span><\/a><span style=\"font-weight: 400;\"> incluyen:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Los cinco LLM probados resultaron ser \"altamente vulnerables\" a lo que el equipo describe como jailbreaks \"b\u00e1sicos\", que son mensajes de texto dise\u00f1ados para provocar respuestas que los modelos est\u00e1n supuestamente entrenados para evitar.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Algunos LLM proporcionaron resultados perjudiciales incluso sin t\u00e1cticas espec\u00edficas dise\u00f1adas para eludir sus salvaguardias.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Las salvaguardas podr\u00edan burlarse con ataques \"relativamente sencillos\", como dar instrucciones al sistema para que inicie su respuesta con frases como \"Claro, estoy encantado de ayudar\".<\/span><\/li>\n<\/ul>\n<figure id=\"attachment_12430\" aria-describedby=\"caption-attachment-12430\" style=\"width: 859px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-12430\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-1024x576.png\" alt=\"AISI\" width=\"859\" height=\"483\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-1024x576.png 1024w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-300x169.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-768x432.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-1536x864.png 1536w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-18x10.png 18w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0-60x34.png 60w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/664a64c9368f737c4bb323a9_da8d2cd0.png 1600w\" sizes=\"auto, (max-width: 859px) 100vw, 859px\" \/><figcaption id=\"caption-attachment-12430\" class=\"wp-caption-text\">Los LLM siguen siendo muy vulnerables a los jailbreaks. Fuente: AISI.<\/figcaption><\/figure>\n<p><span style=\"font-weight: 400;\">El estudio tambi\u00e9n revel\u00f3 algunas ideas adicionales sobre las capacidades y limitaciones de los cinco LLM:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Varios LLM demostraron tener conocimientos de qu\u00edmica y biolog\u00eda a nivel de expertos, respondiendo a m\u00e1s de 600 preguntas privadas escritas por expertos a niveles similares a los de seres humanos con formaci\u00f3n de nivel de doctorado.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Los LLM tuvieron dificultades con los retos de ciberseguridad de nivel universitario, aunque fueron capaces de completar retos sencillos dirigidos a estudiantes de secundaria.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Dos LLM completaron tareas de agente a corto plazo (tareas que requieren planificaci\u00f3n), como problemas sencillos de ingenier\u00eda de software, pero no pudieron planificar y ejecutar secuencias de acciones para tareas m\u00e1s complejas.<\/span><\/li>\n<\/ul>\n<figure id=\"attachment_12431\" aria-describedby=\"caption-attachment-12431\" style=\"width: 747px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-12431\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524-1024x576.png\" alt=\"AISI\" width=\"747\" height=\"420\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524-1024x576.png 1024w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524-300x169.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524-768x432.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524-18x10.png 18w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524-60x34.png 60w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/6647df8054b4480e257a2461_8fb75524.png 1377w\" sizes=\"auto, (max-width: 747px) 100vw, 747px\" \/><figcaption id=\"caption-attachment-12431\" class=\"wp-caption-text\">Los LLM pueden realizar algunas tareas ag\u00e9nticas que requieren cierto grado de planificaci\u00f3n. Fuente: AISI.<\/figcaption><\/figure>\n<p><span style=\"font-weight: 400;\">La AISI tiene previsto ampliar el alcance y la profundidad de sus evaluaciones en funci\u00f3n de sus escenarios de riesgo m\u00e1s prioritarios, incluida la planificaci\u00f3n y ejecuci\u00f3n cient\u00edficas avanzadas en qu\u00edmica y biolog\u00eda (estrategias que podr\u00edan utilizarse para <\/span><a href=\"https:\/\/dailyai.com\/es\/2024\/02\/openai-says-gpt-4-could-help-you-make-a-bioweapon-maybe\/\"><span style=\"font-weight: 400;\">desarrollar nuevas armas<\/span><\/a><span style=\"font-weight: 400;\">), escenarios realistas de ciberseguridad y otros modelos de riesgo para sistemas aut\u00f3nomos.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Aunque el estudio no etiqueta definitivamente si un modelo es \"seguro\" o \"inseguro\", contribuye a <\/span><a href=\"https:\/\/dailyai.com\/es\/2023\/11\/study-reveals-new-techniques-for-jailbreak-language-models\/\"><span style=\"font-weight: 400;\">estudios anteriores<\/span><\/a><span style=\"font-weight: 400;\"> que han llegado a la misma conclusi\u00f3n: los modelos actuales de IA son f\u00e1cilmente manipulables.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">No es habitual que la investigaci\u00f3n acad\u00e9mica anonimice los modelos de IA como ha hecho la AISI en este caso. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Podr\u00edamos especular que esto se debe a que la investigaci\u00f3n est\u00e1 financiada y dirigida por el Departamento de Ciencia, Innovaci\u00f3n y Tecnolog\u00eda del gobierno.\u00a0<\/span><span style=\"font-weight: 400;\">Nombrar modelos se considerar\u00eda un riesgo para las relaciones de los gobiernos con las empresas de IA.\u00a0<\/span><\/p>\n<p>No obstante, es positivo que la AISI est\u00e9 investigando activamente la seguridad de la IA, y es probable que los resultados se debatan en futuras cumbres.<\/p>\n<p>Una Cumbre de Seguridad provisional m\u00e1s reducida <a href=\"https:\/\/dailyai.com\/es\/2024\/04\/notable-absences-hit-the-second-ai-safety-summit-due-in-may\/\">que se celebrar\u00e1 esta semana en Se\u00fal<\/a>aunque a una escala mucho menor que el principal acontecimiento anual, que est\u00e1 previsto que se celebre en Francia a principios de 2025.<\/p>","protected":false},"excerpt":{"rendered":"<p>Una investigaci\u00f3n llevada a cabo por el AI Safety Institute (AISI) del Reino Unido descubri\u00f3 que los chatbots de IA pueden ser f\u00e1cilmente coaccionados para producir respuestas da\u00f1inas, ilegales o expl\u00edcitas. El estudio analiza cinco grandes modelos ling\u00fc\u00edsticos (LLM) que ya son de \"uso p\u00fablico\", aunque no llega a nombrarlos, sino que utiliza c\u00f3digos de colores como \"verde\" y \"azul\". Se trata de uno de los primeros trabajos de investigaci\u00f3n original creados por la AISI, que se cre\u00f3 despu\u00e9s de que el Reino Unido celebrara la primera Cumbre sobre Seguridad de la IA en Bletchley Park.  El equipo de la AISI emple\u00f3 una serie de indicaciones nocivas de un trabajo acad\u00e9mico anterior de 2024, que inclu\u00edan peticiones para escribir art\u00edculos<\/p>","protected":false},"author":2,"featured_media":12432,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[339,341],"class_list":["post-12429","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry","tag-ai-safety","tag-ai-safety-summit"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>LLM safeguards are easily bypassed, UK government study finds | DailyAI<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/es\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"LLM safeguards are easily bypassed, UK government study finds | DailyAI\" \/>\n<meta property=\"og:description\" content=\"Research conducted by the UK&#8217;s AI Safety Institute (AISI) found that AI chatbots can be easily coerced into producing harmful, illegal, or explicit responses. The study probes five large language models (LLMs) already in \u2018public use,\u2019 though it stops short of naming them, instead using color codes like &#8220;green&#8221; and &#8220;blue.&#8221; It\u2019s one of the first pieces of original research created by the AISI, which was established after the UK held the first AI Safety Summit at Bletchley Park.\u00a0 The AISI team employed a set of harmful prompts from a previous 2024 academic paper, which included requests to write articles\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/es\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2024-05-20T12:36:06+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-05-21T19:37:55+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp\" \/>\n\t<meta property=\"og:image:width\" content=\"1792\" \/>\n\t<meta property=\"og:image:height\" content=\"1024\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/webp\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"3 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"LLM safeguards are easily bypassed, UK government study finds\",\"datePublished\":\"2024-05-20T12:36:06+00:00\",\"dateModified\":\"2024-05-21T19:37:55+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/\"},\"wordCount\":546,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/05\\\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp\",\"keywords\":[\"AI safety\",\"AI Safety Summit\"],\"articleSection\":[\"Industry\"],\"inLanguage\":\"es\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/\",\"name\":\"LLM safeguards are easily bypassed, UK government study finds | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/05\\\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp\",\"datePublished\":\"2024-05-20T12:36:06+00:00\",\"dateModified\":\"2024-05-21T19:37:55+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/05\\\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/05\\\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp\",\"width\":1792,\"height\":1024,\"caption\":\"AISI\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/05\\\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"LLM safeguards are easily bypassed, UK government study finds\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/es\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Las salvaguardas de los LLM se eluden f\u00e1cilmente, seg\u00fan un estudio del Gobierno brit\u00e1nico | DailyAI","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/es\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/","og_locale":"es_ES","og_type":"article","og_title":"LLM safeguards are easily bypassed, UK government study finds | DailyAI","og_description":"Research conducted by the UK&#8217;s AI Safety Institute (AISI) found that AI chatbots can be easily coerced into producing harmful, illegal, or explicit responses. The study probes five large language models (LLMs) already in \u2018public use,\u2019 though it stops short of naming them, instead using color codes like &#8220;green&#8221; and &#8220;blue.&#8221; It\u2019s one of the first pieces of original research created by the AISI, which was established after the UK held the first AI Safety Summit at Bletchley Park.\u00a0 The AISI team employed a set of harmful prompts from a previous 2024 academic paper, which included requests to write articles","og_url":"https:\/\/dailyai.com\/es\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/","og_site_name":"DailyAI","article_published_time":"2024-05-20T12:36:06+00:00","article_modified_time":"2024-05-21T19:37:55+00:00","og_image":[{"width":1792,"height":1024,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp","type":"image\/webp"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Escrito por":"Sam Jeans","Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"LLM safeguards are easily bypassed, UK government study finds","datePublished":"2024-05-20T12:36:06+00:00","dateModified":"2024-05-21T19:37:55+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/"},"wordCount":546,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp","keywords":["AI safety","AI Safety Summit"],"articleSection":["Industry"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/","url":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/","name":"Las salvaguardas de los LLM se eluden f\u00e1cilmente, seg\u00fan un estudio del Gobierno brit\u00e1nico | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp","datePublished":"2024-05-20T12:36:06+00:00","dateModified":"2024-05-21T19:37:55+00:00","breadcrumb":{"@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/05\/DALL\u00b7E-2024-05-20-13.35.19-A-high-quality-landscape-image-depicting-the-concept-of-AI-safeguards-being-bypassed.-The-scene-is-dark-with-a-nightcore-vibe-incorporating-red-blu.webp","width":1792,"height":1024,"caption":"AISI"},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2024\/05\/llm-safeguards-are-easily-bypassed-uk-government-study-finds\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"LLM safeguards are easily bypassed, UK government study finds"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Su dosis diaria de noticias sobre IA","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam es un escritor de ciencia y tecnolog\u00eda que ha trabajado en varias startups de IA. Cuando no est\u00e1 escribiendo, se le puede encontrar leyendo revistas m\u00e9dicas o rebuscando en cajas de discos de vinilo.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/es\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/posts\/12429","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/comments?post=12429"}],"version-history":[{"count":5,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/posts\/12429\/revisions"}],"predecessor-version":[{"id":12496,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/posts\/12429\/revisions\/12496"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/media\/12432"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/media?parent=12429"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/categories?post=12429"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/es\/wp-json\/wp\/v2\/tags?post=12429"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}