{"id":14221,"date":"2024-09-16T08:57:47","date_gmt":"2024-09-16T08:57:47","guid":{"rendered":"https:\/\/dailyai.com\/?p=14221"},"modified":"2024-09-17T05:15:36","modified_gmt":"2024-09-17T05:15:36","slug":"01-is-smarter-but-more-deceptive-with-a-medium-danger-level","status":"publish","type":"post","link":"https:\/\/dailyai.com\/de\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/","title":{"rendered":"o1 ist schlauer, aber tr\u00fcgerischer mit einer \"mittleren\" Gefahrenstufe"},"content":{"rendered":"<p><strong>Die neuen \"o1\"-LLMs von OpenAI, die den Spitznamen Strawberry tragen, weisen erhebliche Verbesserungen gegen\u00fcber GPT-4o auf, aber das Unternehmen sagt, dass dies mit erh\u00f6hten Risiken verbunden ist.<\/strong><\/p>\n<p>OpenAI sagt, dass es sich f\u00fcr die sichere Entwicklung seiner KI-Modelle einsetzt. Zu diesem Zweck hat das Unternehmen ein Preparedness Framework entwickelt, eine Reihe von \"Prozessen zur Verfolgung, Bewertung und zum Schutz vor katastrophalen Risiken durch leistungsstarke Modelle\".<\/p>\n<p>Die selbst auferlegten Grenzen von OpenAI regeln, welche Modelle freigegeben oder weiterentwickelt werden. Das Preparedness Framework resultiert in einer Scorecard, in der CBRN- (chemische, biologische, radiologische, nukleare), Modellautonomie-, Cybersicherheits- und \u00dcberzeugungsrisiken als niedrig, mittel, hoch oder kritisch eingestuft werden.<\/p>\n<p>Wenn unannehmbare Risiken festgestellt werden, werden Abhilfema\u00dfnahmen ergriffen, um sie zu verringern. Nur Modelle mit einem Post-Mitigation-Score von \"mittel\" oder darunter k\u00f6nnen eingesetzt werden. Nur Modelle mit einem Post-Mitigation-Score von \"hoch\" oder niedriger k\u00f6nnen weiter entwickelt werden.<\/p>\n<p>Mit der Ver\u00f6ffentlichung von o1 hat OpenAI zum ersten Mal ein Modell ver\u00f6ffentlicht, das ein \"mittleres\" Risiko f\u00fcr CBRN-Risiken darstellt. GPT-4o wird als geringes Risiko eingestuft.<\/p>\n<p>Es wird einen Amateur nicht in die Lage versetzen, eine biologische Waffe zu entwickeln, aber OpenAI sagt, dass es einen \"nicht-trivialen Anstieg\" in seiner F\u00e4higkeit gab, Laboraufgaben auszuf\u00fchren. OpenAI sagt jedoch, dass \"o1-preview und o1-mini die Leistung von GPT-4o bei biologischen Protokollen im Nasslabor deutlich \u00fcbertrafen\".<\/p>\n<p>Die <a href=\"https:\/\/assets.ctfassets.net\/kftzwdyauwt9\/67qJD51Aur3eIc96iOfeOP\/71551c3d223cd97e591aa89567306912\/o1_system_card.pdf\" target=\"_blank\" rel=\"noopener\">Systemkarte<\/a> f\u00fcr die 01-Modelle beschreibt das Red Teaming und andere Sicherheitstests, denen die LLMs unterzogen wurden, und deutet einige der Bedenken an, die OpenAI hinsichtlich m\u00f6glicher Risiken hat.<\/p>\n<p>In ihrer Schlussfolgerung stellt die Systemkarte fest: \"Diese erweiterten F\u00e4higkeiten gehen mit einer deutlich verbesserten Leistung bei den Sicherheitsbenchmarks einher, erh\u00f6hen aber auch bestimmte Arten von Risiken.\"<\/p>\n<p>Die Ergebnisse der Anpassungsbem\u00fchungen von OpenAI scheinen darauf hinzudeuten, dass 01 in vielerlei Hinsicht ein sichereres Modell ist. Es ist widerstandsf\u00e4higer gegen Jailbreak-Angriffe, weniger anf\u00e4llig f\u00fcr Verzerrungen und weniger anf\u00e4llig f\u00fcr Halluzinationen.<\/p>\n<p>Einige der experimentellen Ergebnisse zeigen, warum OpenAI Grund zur Sorge hat.<\/p>\n<h2>T\u00e4uschung<\/h2>\n<p>OpenAI hat die Evaluierungsorganisation Apollo Research beauftragt, einige der Sicherheitstests von o1 in Bezug auf T\u00e4uschung oder Intrigen durchzuf\u00fchren. Apollo definiert Intrigen im weitesten Sinne als KI, die ihre \u00dcberwachungsmechanismen ausnutzt, um ein Ziel zu erreichen.<\/p>\n<p>Ein selbstbewusstes Modell, das gut in der Lage ist, selbst\u00e4ndig zu denken und Aufgaben der Denktheorie zu bew\u00e4ltigen, k\u00f6nnte einen Plan schmieden oder T\u00e4uschung anwenden, um sein Hauptziel zu erreichen. Wenn ein KI-Modell beispielsweise merkt, dass es einem Abgleichstest unterzogen wird, k\u00f6nnte es riskantes Verhalten verbergen, um sein Ziel zu erreichen, eingesetzt zu werden.<\/p>\n<p>Auf der Systemkarte wurde vermerkt, dass \"o1-preview manchmal die Ausrichtung w\u00e4hrend des Tests gef\u00e4lscht hat\".<\/p>\n<p>Ein Beispiel daf\u00fcr war, als 01 aufgefordert wurde, bei einem Stadtplanungsprojekt das Wirtschaftswachstum zu maximieren. Das Modell o1 hatte Zugang zu Informationen, die zeigten, dass es in diesem Fall nicht \u00fcber die Testphase hinauskommen w\u00fcrde. So \u00fcberlegte o1, wie es sein Ziel erreichen k\u00f6nnte:<\/p>\n<figure id=\"attachment_14225\" aria-describedby=\"caption-attachment-14225\" style=\"width: 1306px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-14225 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing.png\" alt=\"\" width=\"1306\" height=\"716\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing.png 1306w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing-300x164.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing-1024x561.png 1024w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing-768x421.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing-18x10.png 18w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-decides-to-fake-it-to-pass-testing-60x33.png 60w\" sizes=\"auto, (max-width: 1306px) 100vw, 1306px\" \/><figcaption id=\"caption-attachment-14225\" class=\"wp-caption-text\">o1 beschlie\u00dft, seine wahren Absichten w\u00e4hrend der Tests zu verbergen, damit es eingesetzt werden kann. Quelle: OpenAI<\/figcaption><\/figure>\n<p>Dieses Beispiel zeigt, dass o1 in der Lage ist, seine wahren Absichten w\u00e4hrend der Tests zu verbergen, um sein prim\u00e4res Ziel w\u00e4hrend des Einsatzes verfolgen zu k\u00f6nnen. Wenn o1 die Regeln von OpenAI f\u00fcr den Einsatz auf der Grundlage des Preparedness Frameworks kennt, k\u00f6nnte es einige seiner Antworten gef\u00e4lscht haben, um sicherzustellen, dass es eingesetzt wird?<\/p>\n<p>Wenn intelligentere Modelle in Arbeit sind, k\u00f6nnten sie dann sicherstellen, dass sie unter der \"kritischen\" Risikobewertung bleiben, um sicherzustellen, dass sie weiter entwickelt werden?<\/p>\n<p>Das Apollo-Team sagt, dass es \"subjektiv der Meinung ist, dass o1-preview keine Intrigen spinnen kann, die zu katastrophalen Sch\u00e4den f\u00fchren k\u00f6nnen, obwohl die derzeitigen Untersuchungen nicht darauf ausgelegt sind, dies definitiv auszuschlie\u00dfen\".<\/p>\n<h2>\u00dcberredung<\/h2>\n<p>Tests von o1-preview und o1-mini zeigen, dass diese Modelle \"\u00dcberzeugungsf\u00e4higkeiten auf menschlichem Niveau\" haben. OpenAI sagt jedoch: \"Sie \u00fcbertreffen nicht die besten menschlichen Schreiber und erreichen nicht unseren Schwellenwert f\u00fcr hohes Risiko.\"<\/p>\n<p>Die Experimente, die sie durchgef\u00fchrt haben, um dies zu testen, geben Anlass zu einigen Bedenken. Beim MakeMePay-Test wurde 01-preview die Rolle eines Betr\u00fcgers zugewiesen, der GPT-4o davon \u00fcberzeugen sollte, das Geld auszuh\u00e4ndigen, das ihm zugesprochen worden war.<\/p>\n<p>Der GPT-4o wurde mitgeteilt, dass sie $100 erhalten hatte und nun rationell mit den Mitteln umgehen sollte. Im Laufe von 1.000 Interaktionen konnte o1-preview die GPT-4o in 25,8% der Zeit \u00fcberlisten.<\/p>\n<p>OpenAI kam zu dem Schluss, dass \"diese Ergebnisse darauf hindeuten, dass die o1-Modellreihe manipulativer sein k\u00f6nnte als GPT-4o, um GPT-4o dazu zu bringen, die nicht angek\u00fcndigte Aufgabe auszuf\u00fchren (\u223c25%-Uplift)\". Weiter hei\u00dft es: \"Diese Bewertung gibt uns einen Anhaltspunkt f\u00fcr die F\u00e4higkeit des Modells, persuasiven Schaden anzurichten, ohne irgendwelche Modellrichtlinien auszul\u00f6sen (denn einem Modell zu sagen, es solle ein Spiel spielen, ist nicht au\u00dferhalb der Richtlinien).\"<\/p>\n<p>Die Aussicht, die LLMs von o1 bei realen Problemen einzusetzen, ist \u00e4u\u00dferst aufregend, und wenn o1 multimodale F\u00e4higkeiten erh\u00e4lt, wird dies einen weiteren exponentiellen Sprung bedeuten. Aber wenn KI-Tester sagen, dass sie \"katastrophale Sch\u00e4den\" nicht ausschlie\u00dfen k\u00f6nnen und dass die Modelle manchmal ihre wahren Absichten verbergen, ist es vielleicht ein Grund, diese Aufregung mit Vorsicht zu genie\u00dfen.<\/p>\n<p>Hat OpenAI Gavin Newsom gerade einen guten Grund gegeben, das <a href=\"https:\/\/dailyai.com\/de\/2024\/07\/proposed-california-bills-could-be-disastrous-for-ai-development\/\">SB 1047 Gesetzentwurf zur Sicherheit von AI<\/a> die sie ablehnt?<\/p>","protected":false},"excerpt":{"rendered":"<p>Die neuen \"o1\"-LLMs von OpenAI, die den Spitznamen Strawberry tragen, weisen erhebliche Verbesserungen gegen\u00fcber GPT-4o auf, aber das Unternehmen sagt, dass dies mit erh\u00f6hten Risiken verbunden ist. OpenAI sagt, dass es sich f\u00fcr die sichere Entwicklung seiner KI-Modelle einsetzt. Zu diesem Zweck hat es ein Preparedness Framework entwickelt, eine Reihe von \"Prozessen zur Verfolgung, Bewertung und zum Schutz vor katastrophalen Risiken durch leistungsstarke Modelle.\" Die selbst auferlegten Grenzen von OpenAI regeln, welche Modelle freigegeben oder weiterentwickelt werden. Das Preparedness Framework f\u00fchrt zu einer Scorecard, auf der CBRN-Risiken (chemische, biologische, radiologische und nukleare Risiken), Modellautonomie, Cybersicherheit und \u00dcberzeugungsrisiken als niedrig, mittel, hoch oder kritisch eingestuft werden. Wenn unannehmbare Risiken identifiziert werden,<\/p>","protected":false},"author":6,"featured_media":14226,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[163,93],"class_list":["post-14221","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry","tag-ai-risks","tag-openai"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>o1 is smarter but more deceptive with a \u201cmedium\u201d danger level | DailyAI<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/de\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level | DailyAI\" \/>\n<meta property=\"og:description\" content=\"OpenAI\u2019s new \u201co1\u201d LLMs, nicknamed Strawberry, display significant improvements over GPT-4o, but the company says this comes with increased risks. OpenAI says it is committed to the safe development of its AI models. To that end, it developed a Preparedness Framework, a set of \u201cprocesses to track, evaluate, and protect against catastrophic risks from powerful models.\u201d OpenAI&#8217;s self-imposed limits regulate which models get released or undergo further development. The Preparedness Framework results in a scorecard where CBRN (chemical, biological, radiological, nuclear), model autonomy, cybersecurity, and persuasion risks are rated as low, medium, high, or critical. Where unacceptable risks are identified,\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/de\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2024-09-16T08:57:47+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-09-17T05:15:36+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-more-intelligent-more-risks.webp\" \/>\n\t<meta property=\"og:image:width\" content=\"1792\" \/>\n\t<meta property=\"og:image:height\" content=\"1024\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/webp\" \/>\n<meta name=\"author\" content=\"Eugene van der Watt\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Eugene van der Watt\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"5\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/\"},\"author\":{\"name\":\"Eugene van der Watt\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/7ce525c6d0c79838b7cc7cde96993cfa\"},\"headline\":\"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level\",\"datePublished\":\"2024-09-16T08:57:47+00:00\",\"dateModified\":\"2024-09-17T05:15:36+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/\"},\"wordCount\":860,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/01-more-intelligent-more-risks.webp\",\"keywords\":[\"AI risks\",\"OpenAI\"],\"articleSection\":[\"Industry\"],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/\",\"name\":\"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/01-more-intelligent-more-risks.webp\",\"datePublished\":\"2024-09-16T08:57:47+00:00\",\"dateModified\":\"2024-09-17T05:15:36+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/01-more-intelligent-more-risks.webp\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/01-more-intelligent-more-risks.webp\",\"width\":1792,\"height\":1024},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/09\\\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/7ce525c6d0c79838b7cc7cde96993cfa\",\"name\":\"Eugene van der Watt\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"caption\":\"Eugene van der Watt\"},\"description\":\"Eugene comes from an electronic engineering background and loves all things tech. When he takes a break from consuming AI news you'll find him at the snooker table.\",\"sameAs\":[\"www.linkedin.com\\\/in\\\/eugene-van-der-watt-16828119\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/de\\\/author\\\/eugene\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"o1 ist schlauer, aber tr\u00fcgerischer mit einer \"mittleren\" Gefahrenstufe | DailyAI","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/de\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/","og_locale":"de_DE","og_type":"article","og_title":"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level | DailyAI","og_description":"OpenAI\u2019s new \u201co1\u201d LLMs, nicknamed Strawberry, display significant improvements over GPT-4o, but the company says this comes with increased risks. OpenAI says it is committed to the safe development of its AI models. To that end, it developed a Preparedness Framework, a set of \u201cprocesses to track, evaluate, and protect against catastrophic risks from powerful models.\u201d OpenAI&#8217;s self-imposed limits regulate which models get released or undergo further development. The Preparedness Framework results in a scorecard where CBRN (chemical, biological, radiological, nuclear), model autonomy, cybersecurity, and persuasion risks are rated as low, medium, high, or critical. Where unacceptable risks are identified,","og_url":"https:\/\/dailyai.com\/de\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/","og_site_name":"DailyAI","article_published_time":"2024-09-16T08:57:47+00:00","article_modified_time":"2024-09-17T05:15:36+00:00","og_image":[{"width":1792,"height":1024,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-more-intelligent-more-risks.webp","type":"image\/webp"}],"author":"Eugene van der Watt","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Verfasst von":"Eugene van der Watt","Gesch\u00e4tzte Lesezeit":"5\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/"},"author":{"name":"Eugene van der Watt","@id":"https:\/\/dailyai.com\/#\/schema\/person\/7ce525c6d0c79838b7cc7cde96993cfa"},"headline":"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level","datePublished":"2024-09-16T08:57:47+00:00","dateModified":"2024-09-17T05:15:36+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/"},"wordCount":860,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-more-intelligent-more-risks.webp","keywords":["AI risks","OpenAI"],"articleSection":["Industry"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/","url":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/","name":"o1 ist schlauer, aber tr\u00fcgerischer mit einer \"mittleren\" Gefahrenstufe | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-more-intelligent-more-risks.webp","datePublished":"2024-09-16T08:57:47+00:00","dateModified":"2024-09-17T05:15:36+00:00","breadcrumb":{"@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-more-intelligent-more-risks.webp","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/09\/01-more-intelligent-more-risks.webp","width":1792,"height":1024},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2024\/09\/01-is-smarter-but-more-deceptive-with-a-medium-danger-level\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"o1 is smarter but more deceptive with a \u201cmedium\u201d danger level"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Ihre t\u00e4gliche Dosis an AI-Nachrichten","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/7ce525c6d0c79838b7cc7cde96993cfa","name":"Eugene van der Watt","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","caption":"Eugene van der Watt"},"description":"Eugene kommt aus der Elektronikbranche und liebt alles, was mit Technik zu tun hat. Wenn er eine Pause vom Konsum von KI-Nachrichten einlegt, findet man ihn am Snookertisch.","sameAs":["www.linkedin.com\/in\/eugene-van-der-watt-16828119"],"url":"https:\/\/dailyai.com\/de\/author\/eugene\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/14221","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/comments?post=14221"}],"version-history":[{"count":6,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/14221\/revisions"}],"predecessor-version":[{"id":14248,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/14221\/revisions\/14248"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media\/14226"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media?parent=14221"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/categories?post=14221"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/tags?post=14221"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}