{"id":6851,"date":"2023-10-27T19:21:39","date_gmt":"2023-10-27T19:21:39","guid":{"rendered":"https:\/\/dailyai.com\/?p=6851"},"modified":"2023-10-27T22:55:24","modified_gmt":"2023-10-27T22:55:24","slug":"ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization","status":"publish","type":"post","link":"https:\/\/dailyai.com\/sv\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/","title":{"rendered":"AI uts\u00e4tts f\u00f6r tester av Theory of Mind och systematisk generalisering"},"content":{"rendered":"<p><b>Forskare har introducerat FANToM, ett nytt benchmark som \u00e4r utformat f\u00f6r att rigor\u00f6st testa och utv\u00e4rdera stora spr\u00e5kmodellers (LLM) f\u00f6rst\u00e5else och till\u00e4mpning av Theory of Mind (ToM).<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Theory of Mind avser f\u00f6rm\u00e5gan att tillskriva sig sj\u00e4lv och andra f\u00f6rest\u00e4llningar, \u00f6nskningar och kunskaper samt f\u00f6rst\u00e5 att andra har f\u00f6rest\u00e4llningar och perspektiv som skiljer sig fr\u00e5n ens egna.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">ToM anses vara grunden till det medvetande som intelligenta djur besitter. F\u00f6rutom m\u00e4nniskor anses \u00e4ven primater som orangutanger, gorillor och schimpanser ha ToM, liksom vissa icke-primater som papegojor och medlemmar av kr\u00e5kf\u00e5gelfamiljen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">I takt med att AI-modellerna blir allt mer komplexa s\u00f6ker AI-forskarna nya metoder f\u00f6r att utv\u00e4rdera f\u00f6rm\u00e5gor som ToM.<\/span><\/p>\n<p><a href=\"https:\/\/hyunw.kim\/fantom\/\"><span style=\"font-weight: 400;\">Ett nytt riktm\u00e4rke kallat FANToM<\/span><\/a><span style=\"font-weight: 400;\">som skapats av forskare fr\u00e5n Allen Institute for AI, University of Washington, Carnegie Mellon University och Seoul National University, uts\u00e4tter modeller f\u00f6r maskininl\u00e4rning f\u00f6r dynamiska scenarier som \u00e5terspeglar interaktioner i verkliga livet.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Med FANToM g\u00e5r karakt\u00e4rer in i och ut ur konversationer, vilket utmanar AI-modellerna att uppr\u00e4tth\u00e5lla en korrekt f\u00f6rst\u00e5else f\u00f6r vem som vet vad i varje givet \u00f6gonblick.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">N\u00e4r stora spr\u00e5kmodeller (LLM) utsattes f\u00f6r FANToM visade det sig att \u00e4ven de mest avancerade modellerna har sv\u00e5rt att uppr\u00e4tth\u00e5lla en konsekvent ToM.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Modellernas prestanda var betydligt l\u00e4gre \u00e4n de m\u00e4nskliga deltagarnas, vilket belyser AI:s begr\u00e4nsningar n\u00e4r det g\u00e4ller att f\u00f6rst\u00e5 och navigera i komplexa sociala interaktioner.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Faktum \u00e4r att m\u00e4nniskan dominerade alla kategorier, se nedan.\u00a0<\/span><\/p>\n<figure id=\"attachment_6852\" aria-describedby=\"caption-attachment-6852\" style=\"width: 1024px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-6852 size-large\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-1024x213.png\" alt=\"AI ToM\" width=\"1024\" height=\"213\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-1024x213.png 1024w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-300x63.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-768x160.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-370x77.png 370w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-800x167.png 800w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-740x154.png 740w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-20x4.png 20w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-1320x275.png 1320w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart-230x48.png 230w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/scores_barchart.png 1367w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption id=\"caption-attachment-6852\" class=\"wp-caption-text\">M\u00e4nniskor var mycket b\u00e4ttre p\u00e5 att svara p\u00e5 ToM-relaterade fr\u00e5gor j\u00e4mf\u00f6rt med popul\u00e4ra LLM:er. K\u00e4llor: <a href=\"https:\/\/hyunw.kim\/fantom\/\">FANToM<\/a>.<\/figcaption><\/figure>\n<p><span style=\"font-weight: 400;\">En intressant sidopunkt \u00e4r att oktoberversionen av GPT-4-modellens iteration \u00f6vertr\u00e4ffades av en tidigare juniversion, vilket kan st\u00f6dja de senaste anekdoterna bland anv\u00e4ndarna om att <\/span><a href=\"https:\/\/dailyai.com\/sv\/2023\/07\/is-chatgpt-getting-worse-heres-everything-we-know-so-far\/\"><span style=\"font-weight: 400;\">ChatGPT blir allt v\u00e4rre<\/span><\/a><span style=\"font-weight: 400;\">.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">FANToM avsl\u00f6jade ocks\u00e5 tekniker f\u00f6r att f\u00f6rb\u00e4ttra LLM ToM, till exempel tankekedje-resonemang och andra finjusteringsmetoder. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Skillnaden mellan AI:s och m\u00e4nniskors ToM-kompetens \u00e4r dock fortfarande stor.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400;\">AI tar steg mot m\u00e4nniskoliknande spr\u00e5kkunskaper<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">I ett n\u00e5got relaterat men separat <\/span><a href=\"https:\/\/www.nature.com\/articles\/d41586-023-03272-3\"><span style=\"font-weight: 400;\">studie publicerad i Nature<\/span><\/a><span style=\"font-weight: 400;\">har forskare utvecklat ett neuralt n\u00e4tverk som kan generalisera spr\u00e5k p\u00e5 ett s\u00e4tt som liknar m\u00e4nniskans.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Det nya neurala n\u00e4tverket uppvisade en imponerande f\u00f6rm\u00e5ga att integrera nyinl\u00e4rda ord i sitt befintliga ordf\u00f6rr\u00e5d. Det kunde sedan anv\u00e4nda dessa ord i olika sammanhang, en kognitiv f\u00e4rdighet som kallas systematisk generalisering.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">M\u00e4nniskan har en naturlig f\u00f6rm\u00e5ga till systematisk generalisering och inf\u00f6rlivar s\u00f6ml\u00f6st ny vokabul\u00e4r i sin repertoar.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">N\u00e4r n\u00e5gon till exempel l\u00e4r sig termen \"fotobomb\" kan de till\u00e4mpa den i olika situationer n\u00e4stan omedelbart. Ny slang dyker upp hela tiden, och m\u00e4nniskor tar naturligt till sig den i sitt ordf\u00f6rr\u00e5d.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Forskarna utsatte b\u00e5de sitt eget anpassade neurala n\u00e4tverk och ChatGPT f\u00f6r en serie tester och fann att ChatGPT sl\u00e4pade efter den anpassade modellen i prestanda.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Medan LLM:er som ChatGPT utm\u00e4rker sig i m\u00e5nga konversationsscenarier uppvisar de m\u00e4rkbara inkonsekvenser och luckor i andra, ett problem som detta nya neurala n\u00e4tverk tar itu med.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">F\u00f6r att unders\u00f6ka den h\u00e4r aspekten av spr\u00e5klig kommunikation genomf\u00f6rde forskare ett experiment med 25 m\u00e4nskliga deltagare d\u00e4r de bed\u00f6mde deras f\u00f6rm\u00e5ga att anv\u00e4nda nyinl\u00e4rda ord i olika sammanhang. <\/span><span style=\"font-weight: 400;\">F\u00f6rs\u00f6kspersonerna introducerades till ett pseudospr\u00e5k best\u00e5ende av nonsensord som representerade olika handlingar och regler.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Efter en tr\u00e4ningsfas kunde deltagarna p\u00e5 ett utm\u00e4rkt s\u00e4tt till\u00e4mpa dessa abstrakta regler p\u00e5 nya situationer, vilket visade p\u00e5 en systematisk generalisering.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">N\u00e4r det nyutvecklade neurala n\u00e4tverket utsattes f\u00f6r denna uppgift speglade det den m\u00e4nskliga prestationen. <\/span><span style=\"font-weight: 400;\">N\u00e4r ChatGPT utsattes f\u00f6r samma utmaning hade den dock stora problem och misslyckades mellan 42 och 86% av tiden, beroende p\u00e5 den specifika uppgiften.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Detta \u00e4r viktigt av tv\u00e5 sk\u00e4l. F\u00f6r det f\u00f6rsta kan man h\u00e4vda att detta nya neurala n\u00e4tverk effektivt \u00f6vertr\u00e4ffade GPT-4 p\u00e5 denna specifika uppgift - vilket \u00e4r tillr\u00e4ckligt imponerande. F\u00f6r det andra avsl\u00f6jar denna studie nya metoder f\u00f6r att l\u00e4ra AI-modeller hur man generaliserar nytt spr\u00e5k som m\u00e4nniskor.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Elia Bruni, specialist p\u00e5 bearbetning av naturligt spr\u00e5k vid universitetet i Osnabr\u00fcck i Tyskland, beskriver det som att \"det \u00e4r en stor sak att inf\u00f6ra systematik i neurala n\u00e4tverk\".<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Tillsammans erbjuder dessa tv\u00e5 studier nya tillv\u00e4gag\u00e5ngss\u00e4tt f\u00f6r att tr\u00e4na mer intelligenta AI-modeller som kan konkurrera med m\u00e4nniskor inom kritiska omr\u00e5den som lingvistik och Theory of Mind. <\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Forskare har introducerat FANToM, ett nytt benchmark som \u00e4r utformat f\u00f6r att rigor\u00f6st testa och utv\u00e4rdera stora spr\u00e5kmodellers (LLM) f\u00f6rst\u00e5else och till\u00e4mpning av Theory of Mind (ToM). Theory of Mind avser f\u00f6rm\u00e5gan att tillskriva sig sj\u00e4lv och andra \u00f6vertygelser, \u00f6nskningar och kunskap, och att f\u00f6rst\u00e5 att andra har \u00f6vertygelser och perspektiv som skiljer sig fr\u00e5n ens egna.  ToM anses vara grunden f\u00f6r det medvetande som intelligenta djur besitter. F\u00f6rutom m\u00e4nniskor anses \u00e4ven primater som orangutanger, gorillor och schimpanser ha ToM, liksom vissa icke-primater som papegojor och medlemmar av kr\u00e5kf\u00e5gelfamiljen.  Som AI-modeller<\/p>","protected":false},"author":2,"featured_media":6853,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[404,115,105,93],"class_list":["post-6851","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry","tag-agi","tag-chatgpt","tag-machine-learning","tag-openai"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>AI subjected to tests on Theory of Mind and systematic generalization | DailyAI<\/title>\n<meta name=\"description\" content=\"Researchers have introduced FANToM, a novel benchmark designed to rigorously test and evaluate large language models\u2019 (LLMs) understanding and application of Theory of Mind (ToM).\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/sv\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/\" \/>\n<meta property=\"og:locale\" content=\"sv_SE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"AI subjected to tests on Theory of Mind and systematic generalization | DailyAI\" \/>\n<meta property=\"og:description\" content=\"Researchers have introduced FANToM, a novel benchmark designed to rigorously test and evaluate large language models\u2019 (LLMs) understanding and application of Theory of Mind (ToM).\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/sv\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2023-10-27T19:21:39+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-10-27T22:55:24+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_435449356.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1000\" \/>\n\t<meta property=\"og:image:height\" content=\"667\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Skriven av\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Ber\u00e4knad l\u00e4stid\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minuter\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"AI subjected to tests on Theory of Mind and systematic generalization\",\"datePublished\":\"2023-10-27T19:21:39+00:00\",\"dateModified\":\"2023-10-27T22:55:24+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/\"},\"wordCount\":665,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_435449356.jpg\",\"keywords\":[\"AGI\",\"ChatGPT\",\"machine learning\",\"OpenAI\"],\"articleSection\":[\"Industry\"],\"inLanguage\":\"sv-SE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/\",\"name\":\"AI subjected to tests on Theory of Mind and systematic generalization | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_435449356.jpg\",\"datePublished\":\"2023-10-27T19:21:39+00:00\",\"dateModified\":\"2023-10-27T22:55:24+00:00\",\"description\":\"Researchers have introduced FANToM, a novel benchmark designed to rigorously test and evaluate large language models\u2019 (LLMs) understanding and application of Theory of Mind (ToM).\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#breadcrumb\"},\"inLanguage\":\"sv-SE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_435449356.jpg\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_435449356.jpg\",\"width\":1000,\"height\":667,\"caption\":\"Theory of Mind AI\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"AI subjected to tests on Theory of Mind and systematic generalization\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"sv-SE\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/sv\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"AI uts\u00e4tts f\u00f6r tester av Theory of Mind och systematisk generalisering | DailyAI","description":"Forskare har introducerat FANToM, ett nytt benchmark som \u00e4r utformat f\u00f6r att rigor\u00f6st testa och utv\u00e4rdera stora spr\u00e5kmodellers (LLM) f\u00f6rst\u00e5else och till\u00e4mpning av Theory of Mind (ToM).","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/sv\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/","og_locale":"sv_SE","og_type":"article","og_title":"AI subjected to tests on Theory of Mind and systematic generalization | DailyAI","og_description":"Researchers have introduced FANToM, a novel benchmark designed to rigorously test and evaluate large language models\u2019 (LLMs) understanding and application of Theory of Mind (ToM).","og_url":"https:\/\/dailyai.com\/sv\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/","og_site_name":"DailyAI","article_published_time":"2023-10-27T19:21:39+00:00","article_modified_time":"2023-10-27T22:55:24+00:00","og_image":[{"width":1000,"height":667,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_435449356.jpg","type":"image\/jpeg"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Skriven av":"Sam Jeans","Ber\u00e4knad l\u00e4stid":"4 minuter"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"AI subjected to tests on Theory of Mind and systematic generalization","datePublished":"2023-10-27T19:21:39+00:00","dateModified":"2023-10-27T22:55:24+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/"},"wordCount":665,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_435449356.jpg","keywords":["AGI","ChatGPT","machine learning","OpenAI"],"articleSection":["Industry"],"inLanguage":"sv-SE"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/","url":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/","name":"AI uts\u00e4tts f\u00f6r tester av Theory of Mind och systematisk generalisering | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_435449356.jpg","datePublished":"2023-10-27T19:21:39+00:00","dateModified":"2023-10-27T22:55:24+00:00","description":"Forskare har introducerat FANToM, ett nytt benchmark som \u00e4r utformat f\u00f6r att rigor\u00f6st testa och utv\u00e4rdera stora spr\u00e5kmodellers (LLM) f\u00f6rst\u00e5else och till\u00e4mpning av Theory of Mind (ToM).","breadcrumb":{"@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#breadcrumb"},"inLanguage":"sv-SE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/"]}]},{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_435449356.jpg","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_435449356.jpg","width":1000,"height":667,"caption":"Theory of Mind AI"},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2023\/10\/ai-subjected-to-tests-on-theory-of-mind-and-systematic-generalization\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"AI subjected to tests on Theory of Mind and systematic generalization"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DagligaAI","description":"Din dagliga dos av AI-nyheter","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"sv-SE"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DagligaAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam \u00e4r en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. N\u00e4r han inte skriver l\u00e4ser han medicinska tidskrifter eller gr\u00e4ver igenom l\u00e5dor med vinylskivor.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/sv\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/posts\/6851","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/comments?post=6851"}],"version-history":[{"count":5,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/posts\/6851\/revisions"}],"predecessor-version":[{"id":6866,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/posts\/6851\/revisions\/6866"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/media\/6853"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/media?parent=6851"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/categories?post=6851"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/sv\/wp-json\/wp\/v2\/tags?post=6851"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}