{"id":13401,"date":"2024-07-14T14:53:31","date_gmt":"2024-07-14T14:53:31","guid":{"rendered":"https:\/\/dailyai.com\/?p=13401"},"modified":"2024-07-14T14:53:31","modified_gmt":"2024-07-14T14:53:31","slug":"ai-model-performance-is-it-reasoning-or-simply-reciting","status":"publish","type":"post","link":"https:\/\/dailyai.com\/de\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/","title":{"rendered":"KI-Modellleistung: Ist es logisch denkend oder einfach nur rezitierend?"},"content":{"rendered":"<p><strong>Wenn ChatGPT Ihnen die richtige Antwort auf Ihre Frage gibt, denkt es dann \u00fcber die Anfrage nach oder erinnert es sich einfach an die Antwort aus seinen Trainingsdaten?<\/strong><\/p>\n<p>Forscher des Computer Science and Artificial Intelligence Laboratory (CSAIL) des MIT haben eine Reihe von Tests entwickelt, um herauszufinden, ob KI-Modelle \"denken\" oder nur ein gutes Ged\u00e4chtnis haben.<\/p>\n<p>Wenn Sie ein KI-Modell auffordern, ein mathematisches Problem zu l\u00f6sen, wie z. B. \"Was ist 27+62?\", kommt es schnell mit der richtigen Antwort zur\u00fcck: 89. Wie k\u00f6nnen wir feststellen, ob es die zugrundeliegende Arithmetik versteht oder das Problem nur in seinen Trainingsdaten gesehen hat?<\/p>\n<p>Unter <a href=\"https:\/\/arxiv.org\/pdf\/2307.02477\" target=\"_blank\" rel=\"noopener\">ihr Papier<\/a>Die Forscher testeten GPT-4, GPT-3.5 Turbo, Claude 1.3 und PaLM2, um zu sehen, ob sie \"nicht nur auf unbekannte Instanzen bekannter Aufgaben, sondern auch auf neue Aufgaben verallgemeinern k\u00f6nnen.\"<\/p>\n<p>Sie entwarfen eine Reihe von 11 Aufgaben, die sich leicht von den Standardaufgaben unterschieden, bei denen die LLM im Allgemeinen gut abschneiden.<\/p>\n<p>Die LLMs sollten bei den \"kontrafaktischen Aufgaben\" gleich gut abschneiden, wenn sie allgemeine und \u00fcbertragbare Aufgabenl\u00f6sungsverfahren anwenden.<\/p>\n<p>Wenn ein LLM Mathematik \"versteht\", dann sollte es die korrekte Antwort auf ein mathematisches Problem zur Basis 10 und der selten verwendeten Basis 9 geben, zum Beispiel.<\/p>\n<p>Hier sehen Sie Beispiele f\u00fcr die Aufgaben und die Leistung des GPT-4.<\/p>\n<figure id=\"attachment_13403\" aria-describedby=\"caption-attachment-13403\" style=\"width: 1530px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-13403 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance.png\" alt=\"\" width=\"1530\" height=\"1210\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance.png 1530w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance-300x237.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance-1024x810.png 1024w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance-768x607.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance-15x12.png 15w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/Counterfactual-task-performance-60x47.png 60w\" sizes=\"auto, (max-width: 1530px) 100vw, 1530px\" \/><figcaption id=\"caption-attachment-13403\" class=\"wp-caption-text\">Die Leistung des GPT-4 bei Standardaufgaben (blau) und leicht ver\u00e4nderten kontrafaktischen Aufgaben (orange). Beispiele f\u00fcr die Aufgaben und die richtigen Antworten sind hier zu sehen. Quelle: arXiv<\/figcaption><\/figure>\n<p>Die Leistung des GPT-4 in Standardtests (blaue Linie) ist gut, aber seine F\u00e4higkeiten in Mathematik, logischem Denken, r\u00e4umlichem Denken und anderen Bereichen (orangefarbene Linie) verschlechtern sich erheblich, wenn die Aufgabe leicht ver\u00e4ndert wird.<\/p>\n<p>Die anderen Modelle zeigten eine \u00e4hnliche Verschlechterung, wobei GPT-4 am besten abschnitt.<\/p>\n<p>Trotz dieser Verschlechterung war die Leistung bei kontrafaktischen Aufgaben immer noch besser als der Zufall. Die KI-Modelle versuchen, diese Aufgaben zu l\u00f6sen, sind aber nicht sehr gut darin.<\/p>\n<p>Die Ergebnisse zeigen, dass die beeindruckende Leistung von KI-Modellen bei Aufgaben wie College-Pr\u00fcfungen auf einem hervorragenden Abruf von Trainingsdaten beruht, nicht auf logischem Denken. Dies zeigt auch, dass KI-Modelle nicht auf unbekannte Aufgaben verallgemeinert werden k\u00f6nnen,<\/p>\n<p>Zhaofeng Wu, Doktorand in Elektrotechnik und Informatik am MIT, Mitglied des CSAIL und Hauptautor der Studie, sagte: \"Wir haben einen faszinierenden Aspekt gro\u00dfer Sprachmodelle aufgedeckt: Sie zeichnen sich in vertrauten Szenarien aus, fast wie ein ausgetretener Pfad, haben aber Probleme, wenn das Terrain unbekannt wird. Diese Erkenntnis ist von entscheidender Bedeutung, da wir uns bem\u00fchen, die Anpassungsf\u00e4higkeit dieser Modelle zu verbessern und ihren Anwendungshorizont zu erweitern.\"<\/p>\n<p>Eine \u00e4hnliche Demonstration dieser Unf\u00e4higkeit zur Verallgemeinerung haben wir gesehen, als wir untersuchten, wie schlecht KI-Modelle bei <a href=\"https:\/\/dailyai.com\/de\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/\">ein vereinfachtes R\u00e4tsel zur Fluss\u00fcberquerung zu l\u00f6sen.<\/a><\/p>\n<p>Die Forscher kamen zu dem Schluss, dass die Entwickler bei der Analyse ihrer Modelle \"die abstrakte Aufgabenf\u00e4higkeit losgel\u00f6st von der beobachteten Aufgabenleistung betrachten\" sollten.<\/p>\n<p>Der \"Train-to-test\"-Ansatz kann ein Modell in den Benchmarks nach vorne bringen, bietet aber keinen echten Ma\u00dfstab daf\u00fcr, wie das Modell abschneidet, wenn es eine neue Aufgabe zu bew\u00e4ltigen hat.<\/p>\n<p>Die Forscher vermuten, dass ein Teil des Problems darin besteht, dass diese Modelle nur auf Text in Oberfl\u00e4chenform trainiert werden.<\/p>\n<p>Wenn LLMs mehr kontextualisierten Daten und semantischen Darstellungen aus der realen Welt ausgesetzt sind, k\u00f6nnten sie in der Lage sein, zu verallgemeinern, wenn sie mit verschiedenen Aufgaben konfrontiert werden.<\/p>","protected":false},"excerpt":{"rendered":"<p>Wenn ChatGPT Ihnen die richtige Antwort auf Ihre Frage gibt, denkt es dann \u00fcber die Anfrage nach oder erinnert es sich einfach an die Antwort aus seinen Trainingsdaten? Forscher des Computer Science and Artificial Intelligence Laboratory (CSAIL) des MIT haben eine Reihe von Tests entwickelt, um herauszufinden, ob KI-Modelle \"denken\" oder nur ein gutes Ged\u00e4chtnis haben. Wenn man ein KI-Modell auffordert, ein mathematisches Problem zu l\u00f6sen, z. B. \"Was ist 27+62?\", kommt es schnell mit der richtigen Antwort zur\u00fcck: 89. Wie k\u00f6nnen wir feststellen, ob es die zugrunde liegende Arithmetik versteht oder das Problem einfach nur in seinen Trainingsdaten gesehen hat? In ihrer Arbeit testeten die Forscher GPT-4,<\/p>","protected":false},"author":6,"featured_media":13404,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[118],"class_list":["post-13401","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry","tag-llms"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>AI model performance: Is it reasoning or simply reciting? | DailyAI<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/de\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"AI model performance: Is it reasoning or simply reciting? | DailyAI\" \/>\n<meta property=\"og:description\" content=\"When ChatGPT gives you the right answer to your prompt, does it reason through the request or simply remember the answer from its training data? MIT&#8217;s Computer Science and Artificial Intelligence Laboratory (CSAIL) researchers designed a series of tests to see if AI models \u201cthink\u201d or just have good memories. When you prompt an AI model to solve a math problem like \u201cWhat is 27+62?\u201d it comes back quickly with the correct answer: 89. How could we tell if it understands the underlying arithmetic or simply saw the problem in its training data? In their paper, the researchers tested GPT-4,\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/de\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2024-07-14T14:53:31+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/AI-reasoning.webp\" \/>\n\t<meta property=\"og:image:width\" content=\"1792\" \/>\n\t<meta property=\"og:image:height\" content=\"1024\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/webp\" \/>\n<meta name=\"author\" content=\"Eugene van der Watt\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Eugene van der Watt\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/\"},\"author\":{\"name\":\"Eugene van der Watt\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/7ce525c6d0c79838b7cc7cde96993cfa\"},\"headline\":\"AI model performance: Is it reasoning or simply reciting?\",\"datePublished\":\"2024-07-14T14:53:31+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/\"},\"wordCount\":532,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/07\\\/AI-reasoning.webp\",\"keywords\":[\"LLMS\"],\"articleSection\":[\"Industry\"],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/\",\"name\":\"AI model performance: Is it reasoning or simply reciting? | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/07\\\/AI-reasoning.webp\",\"datePublished\":\"2024-07-14T14:53:31+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/07\\\/AI-reasoning.webp\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/07\\\/AI-reasoning.webp\",\"width\":1792,\"height\":1024},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/07\\\/ai-model-performance-is-it-reasoning-or-simply-reciting\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"AI model performance: Is it reasoning or simply reciting?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/7ce525c6d0c79838b7cc7cde96993cfa\",\"name\":\"Eugene van der Watt\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"caption\":\"Eugene van der Watt\"},\"description\":\"Eugene comes from an electronic engineering background and loves all things tech. When he takes a break from consuming AI news you'll find him at the snooker table.\",\"sameAs\":[\"www.linkedin.com\\\/in\\\/eugene-van-der-watt-16828119\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/de\\\/author\\\/eugene\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"KI-Modellleistung: Ist es logisch denkend oder einfach nur rezitierend? | DailyAI","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/de\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/","og_locale":"de_DE","og_type":"article","og_title":"AI model performance: Is it reasoning or simply reciting? | DailyAI","og_description":"When ChatGPT gives you the right answer to your prompt, does it reason through the request or simply remember the answer from its training data? MIT&#8217;s Computer Science and Artificial Intelligence Laboratory (CSAIL) researchers designed a series of tests to see if AI models \u201cthink\u201d or just have good memories. When you prompt an AI model to solve a math problem like \u201cWhat is 27+62?\u201d it comes back quickly with the correct answer: 89. How could we tell if it understands the underlying arithmetic or simply saw the problem in its training data? In their paper, the researchers tested GPT-4,","og_url":"https:\/\/dailyai.com\/de\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/","og_site_name":"DailyAI","article_published_time":"2024-07-14T14:53:31+00:00","og_image":[{"width":1792,"height":1024,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/AI-reasoning.webp","type":"image\/webp"}],"author":"Eugene van der Watt","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Verfasst von":"Eugene van der Watt","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/"},"author":{"name":"Eugene van der Watt","@id":"https:\/\/dailyai.com\/#\/schema\/person\/7ce525c6d0c79838b7cc7cde96993cfa"},"headline":"AI model performance: Is it reasoning or simply reciting?","datePublished":"2024-07-14T14:53:31+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/"},"wordCount":532,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/AI-reasoning.webp","keywords":["LLMS"],"articleSection":["Industry"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/","url":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/","name":"KI-Modellleistung: Ist es logisch denkend oder einfach nur rezitierend? | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/AI-reasoning.webp","datePublished":"2024-07-14T14:53:31+00:00","breadcrumb":{"@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/AI-reasoning.webp","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/07\/AI-reasoning.webp","width":1792,"height":1024},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2024\/07\/ai-model-performance-is-it-reasoning-or-simply-reciting\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"AI model performance: Is it reasoning or simply reciting?"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Ihre t\u00e4gliche Dosis an AI-Nachrichten","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/7ce525c6d0c79838b7cc7cde96993cfa","name":"Eugene van der Watt","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","caption":"Eugene van der Watt"},"description":"Eugene kommt aus der Elektronikbranche und liebt alles, was mit Technik zu tun hat. Wenn er eine Pause vom Konsum von KI-Nachrichten einlegt, findet man ihn am Snookertisch.","sameAs":["www.linkedin.com\/in\/eugene-van-der-watt-16828119"],"url":"https:\/\/dailyai.com\/de\/author\/eugene\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/13401","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/comments?post=13401"}],"version-history":[{"count":3,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/13401\/revisions"}],"predecessor-version":[{"id":13406,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/13401\/revisions\/13406"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media\/13404"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media?parent=13401"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/categories?post=13401"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/tags?post=13401"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}