{"id":13088,"date":"2024-06-25T13:48:10","date_gmt":"2024-06-25T13:48:10","guid":{"rendered":"https:\/\/dailyai.com\/?p=13088"},"modified":"2024-06-25T14:13:37","modified_gmt":"2024-06-25T14:13:37","slug":"llms-are-really-bad-at-solving-simple-river-crossing-puzzles","status":"publish","type":"post","link":"https:\/\/dailyai.com\/nb\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/","title":{"rendered":"LLM-er er veldig d\u00e5rlige til \u00e5 l\u00f8se enkle elvekryssingsoppgaver"},"content":{"rendered":"<p><strong>Store spr\u00e5kmodeller som GPT-4o kan utf\u00f8re utrolig komplekse oppgaver, men selv de beste modellene sliter med noen grunnleggende resonneringsutfordringer som barn kan l\u00f8se.<\/strong><\/p>\n<p>I et intervju med CBS sa \"gudfaren til AI\", Geoffrey Hinton, at AI-systemer kan v\u00e6re mer intelligente enn vi vet, og at det er en mulighet for at maskinene kan ta over.<\/p>\n<p>P\u00e5 sp\u00f8rsm\u00e5l om niv\u00e5et p\u00e5 dagens AI-teknologi sa Hinton: \"Jeg tror vi er p\u00e5 vei inn i en periode der vi for f\u00f8rste gang noensinne kan ha ting som er mer intelligente enn oss.\"<\/p>\n<p>Metas sjefforsker innen kunstig intelligens, Yann LeCun, vil ha oss til \u00e5 tro at vi er langt unna \u00e5 se kunstig intelligens p\u00e5 \"hundeniv\u00e5\".<\/p>\n<p>S\u00e5 hva er det?<\/p>\n<p>Denne uken la brukere p\u00e5 X ut eksempler p\u00e5 den utrolige kodingsevnen Anthropics <a href=\"https:\/\/dailyai.com\/nb\/2024\/06\/anthropic-releases-claude-sonnet-3-5-which-beats-gpt-4o\/\">ny <span class=\"noTranslate\" data-no-translation=\"\"><span class=\"noTranslate\" data-no-translation=\"\"><span class=\"noTranslate\" data-no-translation=\"\">Claude<\/span><\/span><\/span> modell<\/a> utstillinger. Andre kj\u00f8rte eksperimenter for \u00e5 belyse hvordan AI-modeller fortsatt sliter med helt grunnleggende resonnementer.<\/p>\n<h2>Puslespill om elvekryssing<\/h2>\n<p>Det klassiske elvekryssingspuslespillet har flere varianter, men <a href=\"https:\/\/en.wikipedia.org\/wiki\/Wolf,_goat_and_cabbage_problem\" target=\"_blank\" rel=\"noopener\">Wikipedias versjon<\/a> oppsummerer det slik:<\/p>\n<p>En bonde med en ulv, en geit og et k\u00e5lhode m\u00e5 krysse en elv med b\u00e5t. B\u00e5ten kan bare frakte bonden og en enkelt gjenstand. Hvis de ikke blir passet p\u00e5 sammen, vil ulven spise opp geita, eller geita vil spise opp k\u00e5len. Hvordan kan de krysse elven uten at noe blir spist?<\/p>\n<p>\u00c5 finne l\u00f8sningen krever litt grunnleggende planlegging og resonnering rundt ulike scenarier, men det er ikke et spesielt vanskelig problem \u00e5 l\u00f8se. Hvis du er et menneske.<\/p>\n<p>Kan GPT-4o l\u00f8se det? Hvis du kopierer og limer inn puslespillet i ChatGPT, f\u00e5r du riktig svar, men den Wikipedia-siden var nesten helt sikkert med i treningsdataene.<\/p>\n<p>Hva om vi gjorde puslespillet mye enklere og endret det litt slik at LLM ikke kunne stole p\u00e5 treningsdataene sine?<\/p>\n<p>Den britiske matematikkprofessoren Sir William Timothy Gowers viste hvordan LLM-ernes manglende evne til \u00e5 anvende logikk er lett \u00e5 avsl\u00f8re.<\/p>\n<figure id=\"attachment_13099\" aria-describedby=\"caption-attachment-13099\" style=\"width: 1036px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-13099 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT.png\" alt=\"\" width=\"1036\" height=\"1114\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT.png 1036w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT-279x300.png 279w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT-952x1024.png 952w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT-768x826.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT-11x12.png 11w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle-ChatGPT-60x65.png 60w\" sizes=\"auto, (max-width: 1036px) 100vw, 1036px\" \/><figcaption id=\"caption-attachment-13099\" class=\"wp-caption-text\">ChatGPTs mislykkede fors\u00f8k p\u00e5 \u00e5 l\u00f8se en forenklet elvekryssing. Kilde: <a href=\"https:\/\/x.com\/wtgowers\/status\/1804565549789135256\" target=\"_blank\" rel=\"noopener\">X @wtgowers<\/a><\/figcaption><\/figure>\n<p>Det riktige svaret p\u00e5 g\u00e5ten er at det kun er n\u00f8dvendig med \u00e9n tur. Men det virker som om ChatGPT pr\u00f8ver \u00e5 huske et svar i stedet for \u00e5 resonnere seg gjennom g\u00e5ten.<\/p>\n<p>Er Claude Sonnet 3.5 noe bedre?<\/p>\n<p>Meta Data Scientist Colin Frasers eksperiment bekrefter at selv den ledende AI-modellen som er tilgjengelig i dag, ikke kan l\u00f8se dette enkle puslespillet.<\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\"><span class=\"noTranslate\" data-no-translation=\"\"><span class=\"noTranslate\" data-no-translation=\"\"><span class=\"noTranslate\" data-no-translation=\"\">Claude<\/span><\/span><\/span> kan fortsatt ikke l\u00f8se det umulige problemet med \u00e9n bonde, \u00e9n sau, \u00e9n b\u00e5t <a href=\"https:\/\/t.co\/TU13wermLZ\">pic.twitter.com\/TU13wermLZ<\/a><\/p>\n<p>- Colin Fraser (@colin_fraser) <a href=\"https:\/\/twitter.com\/colin_fraser\/status\/1803870308908048695?ref_src=twsrc%5Etfw\">20. juni 2024<\/a><\/p><\/blockquote>\n<p><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<p>Det kan ha v\u00e6rt litt u\u00e6rlig av en dataforsker fra Meta \u00e5 ikke vise resultatene sine ved hjelp av Llama 3.<\/p>\n<p>Jeg stilte Meta AI det samme sp\u00f8rsm\u00e5let, og det blir ogs\u00e5 helt feil.<\/p>\n<figure id=\"attachment_13094\" aria-describedby=\"caption-attachment-13094\" style=\"width: 1362px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-13094 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle.png\" alt=\"\" width=\"1362\" height=\"696\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle.png 1362w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle-300x153.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle-1024x523.png 1024w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle-768x392.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle-18x9.png 18w, https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/Llama-3-answer-to-river-crossing-puzzle-60x31.png 60w\" sizes=\"auto, (max-width: 1362px) 100vw, 1362px\" \/><figcaption id=\"caption-attachment-13094\" class=\"wp-caption-text\">Meta AI drevet av Llama 3 svarer ogs\u00e5 feil p\u00e5 elveg\u00e5ten. Kilde: Meta Meta<\/figcaption><\/figure>\n<p>Yann LeCun forklarte \u00e5rsaken til disse resultatene slik: \"Problemet er at LLM-er ikke har noen sunn fornuft, ingen forst\u00e5else av verden og ingen evne til \u00e5 planlegge (og resonnere).\"<\/p>\n<p>Er det sant, eller er det noe annet som spiller inn?<\/p>\n<p>Det disse interaksjonene kan avsl\u00f8re, er ikke manglende evne til \u00e5 resonnere, men snarere hvor mye resultatet av en LLM p\u00e5virkes av oppl\u00e6ringsdataene. Meta AIs svar, som kaller dette et \"klassisk puslespill\", antyder at det kan v\u00e6re dette som skjer.<\/p>\n<p>Variasjonene av elvekryssingsoppgavene refererer ofte til antall \"turer\" som kreves. N\u00e5r du stiller g\u00e5ten uten \u00e5 bruke det ordet, l\u00f8ser LLM den.<\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">Det er sant. N\u00e5r det ikke er noen ledetekst for \"turer\", som bringer minner om de tidligere l\u00f8sningene av s\u00e5 mange lignende problemer, men ledeteksten \"raskest mulig m\u00e5te\" sammen med COT, svarer den riktig <a href=\"https:\/\/t.co\/E27vBv2y2R\">pic.twitter.com\/E27vBv2y2R<\/a><\/p>\n<p>- AnKo (@anko_979) <a href=\"https:\/\/twitter.com\/anko_979\/status\/1804251359518036429?ref_src=twsrc%5Etfw\">21. juni 2024<\/a><\/p><\/blockquote>\n<p><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<p>Disse eksperimentene var interessante, men de gir ikke noe endelig svar p\u00e5 sp\u00f8rsm\u00e5let om hvorvidt AI-modeller er virkelig intelligente eller bare er prediktive maskiner.<\/p>\n<p>Resultatene viser imidlertid hvor f\u00f8lsomme LLM-er er for treningsdata. N\u00e5r GPT-4o gj\u00f8r LSAT-eksamener, \"tenker\" han da for \u00e5 finne svarene p\u00e5 oppgavene, eller husker han dem?<\/p>\n<p>Inntil ingeni\u00f8rene forst\u00e5r hva som foreg\u00e5r inne i de svarte boksene med kunstig intelligens som de har skapt, vil krangelen om X fortsette \u00e5 st\u00e5 ul\u00f8st.<\/p>","protected":false},"excerpt":{"rendered":"<p>Store spr\u00e5kmodeller som GPT-4o kan utf\u00f8re utrolig komplekse oppgaver, men selv de beste modellene sliter med noen grunnleggende resonneringsutfordringer som barn kan l\u00f8se. I et intervju med CBS sa \"gudfaren til AI\", Geoffrey Hinton, at AI-systemer kan v\u00e6re mer intelligente enn vi vet, og at det er en sjanse for at maskinene kan ta over. P\u00e5 sp\u00f8rsm\u00e5l om niv\u00e5et p\u00e5 dagens AI-teknologi sa Hinton: \"Jeg tror vi er p\u00e5 vei inn i en periode der vi for f\u00f8rste gang noensinne kan ha ting som er mer intelligente enn oss.\" Metas sjefforsker for kunstig intelligens, Yann LeCun, vil ha oss til \u00e5 tro at vi er<\/p>","protected":false},"author":6,"featured_media":13095,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[118],"class_list":["post-13088","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry","tag-llms"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>LLMs are really bad at solving simple river crossing puzzles | DailyAI<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/nb\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/\" \/>\n<meta property=\"og:locale\" content=\"nb_NO\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"LLMs are really bad at solving simple river crossing puzzles | DailyAI\" \/>\n<meta property=\"og:description\" content=\"Large language models like GPT-4o can perform incredibly complex tasks, but even the top models struggle with some basic reasoning challenges that children can solve. In an interview with CBS, the \u2018godfather of AI\u2019, Geoffrey Hinton, said that \u200b\u200bAI systems might be more intelligent than we know and there&#8217;s a chance the machines could take over. When asked about the level of current AI technology Hinton said, \u201cI think we&#8217;re moving into a period when for the first time ever we may have things more intelligent than us.\u201d Meta\u2019s chief AI scientist, Yann LeCun, will have us believe that we\u2019re\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/nb\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2024-06-25T13:48:10+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-06-25T14:13:37+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle.webp\" \/>\n\t<meta property=\"og:image:width\" content=\"1792\" \/>\n\t<meta property=\"og:image:height\" content=\"1024\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/webp\" \/>\n<meta name=\"author\" content=\"Eugene van der Watt\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Skrevet av\" \/>\n\t<meta name=\"twitter:data1\" content=\"Eugene van der Watt\" \/>\n\t<meta name=\"twitter:label2\" content=\"Ansl. lesetid\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutter\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/\"},\"author\":{\"name\":\"Eugene van der Watt\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/7ce525c6d0c79838b7cc7cde96993cfa\"},\"headline\":\"LLMs are really bad at solving simple river crossing puzzles\",\"datePublished\":\"2024-06-25T13:48:10+00:00\",\"dateModified\":\"2024-06-25T14:13:37+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/\"},\"wordCount\":720,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/06\\\/River-crossing-puzzle.webp\",\"keywords\":[\"LLMS\"],\"articleSection\":[\"Industry\"],\"inLanguage\":\"nb-NO\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/\",\"name\":\"LLMs are really bad at solving simple river crossing puzzles | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/06\\\/River-crossing-puzzle.webp\",\"datePublished\":\"2024-06-25T13:48:10+00:00\",\"dateModified\":\"2024-06-25T14:13:37+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#breadcrumb\"},\"inLanguage\":\"nb-NO\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"nb-NO\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/06\\\/River-crossing-puzzle.webp\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/06\\\/River-crossing-puzzle.webp\",\"width\":1792,\"height\":1024},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/06\\\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"LLMs are really bad at solving simple river crossing puzzles\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"nb-NO\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"nb-NO\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/7ce525c6d0c79838b7cc7cde96993cfa\",\"name\":\"Eugene van der Watt\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"nb-NO\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/07\\\/Eugine_Profile_Picture-96x96.png\",\"caption\":\"Eugene van der Watt\"},\"description\":\"Eugene comes from an electronic engineering background and loves all things tech. When he takes a break from consuming AI news you'll find him at the snooker table.\",\"sameAs\":[\"www.linkedin.com\\\/in\\\/eugene-van-der-watt-16828119\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/nb\\\/author\\\/eugene\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"LLM-er er veldig d\u00e5rlige til \u00e5 l\u00f8se enkle elvekryssingsoppgaver | DailyAI","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/nb\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/","og_locale":"nb_NO","og_type":"article","og_title":"LLMs are really bad at solving simple river crossing puzzles | DailyAI","og_description":"Large language models like GPT-4o can perform incredibly complex tasks, but even the top models struggle with some basic reasoning challenges that children can solve. In an interview with CBS, the \u2018godfather of AI\u2019, Geoffrey Hinton, said that \u200b\u200bAI systems might be more intelligent than we know and there&#8217;s a chance the machines could take over. When asked about the level of current AI technology Hinton said, \u201cI think we&#8217;re moving into a period when for the first time ever we may have things more intelligent than us.\u201d Meta\u2019s chief AI scientist, Yann LeCun, will have us believe that we\u2019re","og_url":"https:\/\/dailyai.com\/nb\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/","og_site_name":"DailyAI","article_published_time":"2024-06-25T13:48:10+00:00","article_modified_time":"2024-06-25T14:13:37+00:00","og_image":[{"width":1792,"height":1024,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle.webp","type":"image\/webp"}],"author":"Eugene van der Watt","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Skrevet av":"Eugene van der Watt","Ansl. lesetid":"4 minutter"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/"},"author":{"name":"Eugene van der Watt","@id":"https:\/\/dailyai.com\/#\/schema\/person\/7ce525c6d0c79838b7cc7cde96993cfa"},"headline":"LLMs are really bad at solving simple river crossing puzzles","datePublished":"2024-06-25T13:48:10+00:00","dateModified":"2024-06-25T14:13:37+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/"},"wordCount":720,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle.webp","keywords":["LLMS"],"articleSection":["Industry"],"inLanguage":"nb-NO"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/","url":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/","name":"LLM-er er veldig d\u00e5rlige til \u00e5 l\u00f8se enkle elvekryssingsoppgaver | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle.webp","datePublished":"2024-06-25T13:48:10+00:00","dateModified":"2024-06-25T14:13:37+00:00","breadcrumb":{"@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#breadcrumb"},"inLanguage":"nb-NO","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/"]}]},{"@type":"ImageObject","inLanguage":"nb-NO","@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle.webp","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/06\/River-crossing-puzzle.webp","width":1792,"height":1024},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2024\/06\/llms-are-really-bad-at-solving-simple-river-crossing-puzzles\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"LLMs are really bad at solving simple river crossing puzzles"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DagligAI","description":"Din daglige dose med AI-nyheter","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"nb-NO"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DagligAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"nb-NO","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/7ce525c6d0c79838b7cc7cde96993cfa","name":"Eugene van der Watt","image":{"@type":"ImageObject","inLanguage":"nb-NO","@id":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/07\/Eugine_Profile_Picture-96x96.png","caption":"Eugene van der Watt"},"description":"Eugene har bakgrunn som elektroingeni\u00f8r og elsker alt som har med teknologi \u00e5 gj\u00f8re. N\u00e5r han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.","sameAs":["www.linkedin.com\/in\/eugene-van-der-watt-16828119"],"url":"https:\/\/dailyai.com\/nb\/author\/eugene\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/posts\/13088","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/comments?post=13088"}],"version-history":[{"count":7,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/posts\/13088\/revisions"}],"predecessor-version":[{"id":13107,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/posts\/13088\/revisions\/13107"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/media\/13095"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/media?parent=13088"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/categories?post=13088"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/nb\/wp-json\/wp\/v2\/tags?post=13088"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}