{"id":1871,"date":"2023-06-18T22:43:50","date_gmt":"2023-06-18T22:43:50","guid":{"rendered":"https:\/\/dailyai.com\/?p=1871"},"modified":"2024-03-28T00:48:00","modified_gmt":"2024-03-28T00:48:00","slug":"what-happens-when-ai-starts-consuming-its-own-output","status":"publish","type":"post","link":"https:\/\/dailyai.com\/nl\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","title":{"rendered":"Wat gebeurt er als AI zijn eigen output begint te consumeren?"},"content":{"rendered":"<p><strong>Gegevens zijn het levensbloed van AI, maar het is geen oneindige bron. Kan de mensheid zonder gegevens komen te zitten? Wat gebeurt er als dat gebeurt?<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Complexe AI-modellen vereisen enorme hoeveelheden trainingsgegevens. Voor het trainen van een groot taalmodel (LLM) zoals ChatGPT zijn bijvoorbeeld ongeveer 10 biljoen woorden nodig.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Sommige deskundigen zijn van mening dat de aanvoer van gegevens van hoge kwaliteit afneemt. Een onderzoek uit 2022 van onderzoekers van verschillende universiteiten <a href=\"https:\/\/arxiv.org\/pdf\/2211.04325.pdf\">verklaarde<\/a>, <\/span><span style=\"font-weight: 400\">\"Onze analyse geeft aan dat de voorraad taalgegevens van hoge kwaliteit binnenkort uitgeput zal zijn; waarschijnlijk voor 2026... Ons werk suggereert dat de huidige trend van steeds groeiende ML-modellen die vertrouwen op enorme datasets zou kunnen vertragen als de data-effici\u00ebntie niet drastisch wordt verbeterd of als er nieuwe gegevensbronnen beschikbaar komen.\"\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Het genereren van synthetische gegevens biedt een oplossing, maar slaagt er over het algemeen niet in om de diepte, nuance en variantie van echte gegevens vast te leggen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Om de situatie nog ingewikkelder te maken, maakt men zich zorgen over wat er gebeurt als AI zijn eigen output begint te consumeren, wat volgens onderzoekers van de \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL) in Zwitserland het geval is. <a href=\"https:\/\/www.theregister.com\/2023\/06\/16\/crowd_workers_bots_ai_training\/\">gebeurt al<\/a>. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Hun onderzoek geeft aan dat AI-bedrijven die door mensen geproduceerde gegevens kopen via platforms zoals Amazon Mechanical Turk, in plaats daarvan door AI gegenereerde gegevens kunnen ontvangen.\u00a0<\/span><\/p>\n<p>Wat gebeurt er als AI zijn eigen output begint op te eten? Kan het worden voorkomen?<\/p>\n<h2><span style=\"font-weight: 400\">Het opbouwen van datasets is duur en tijdrovend - en er staat veel op het spel<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Gegevens zijn alomtegenwoordig, maar het operationaliseren ervan voor AI is een complex proces. De kwaliteit van de gegevens en labels be\u00efnvloedt de prestaties van het model - het is een geval van \"vuilnis erin, vuilnis eruit\".\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Om het proces van het samenstellen van datasets kort te beschrijven, nemen data annotators (of labelaars) bewerkte data (bijvoorbeeld een bijgesneden afbeelding) en labelen <\/span><span style=\"font-weight: 400\">kenmerken (bijvoorbeeld een auto, een persoon, een vogel).\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dit geeft algoritmen een 'doel' om van te leren. De algoritmen extraheren en analyseren kenmerken uit gelabelde gegevens om die kenmerken te voorspellen in nieuwe, ongeziene gegevens. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Dit is nodig voor supervised machine learning, een van de kerntakken van machine learning naast unsupervised machine learning en reinforcement learning. Door <a href=\"https:\/\/medium.com\/cognilytica\/data-preparation-labeling-for-ai-2020-b512a5ed777c\">sommige schattingen<\/a>Het voorbereiden en labelen van gegevens neemt 80% in beslag van de duur van een project voor een machine-learningmodel, maar als je te veel hooi op je vork neemt, loop je het risico dat de prestaties van een model in gevaar komen. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Naast de praktische uitdagingen om datasets van hoge kwaliteit te maken, verandert de aard van data voortdurend. Wat je 10 jaar geleden zou defini\u00ebren als een \"dataset met een typische selectie van voertuigen op de weg\" is vandaag de dag niet meer hetzelfde. Nu vind je bijvoorbeeld veel meer eScooters en eBikes op de weg.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dit worden \"randgevallen\" genoemd, wat zeldzame objecten of fenomenen zijn die niet voorkomen in datasets.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Modellen weerspiegelen de kwaliteit van hun datasets<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Als je een modern AI-systeem traint op een oude dataset, loopt het model het risico slecht te presteren wanneer het wordt blootgesteld aan nieuwe, ongeziene gegevens.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Tussen 2015 en 2020 ontdekten onderzoekers grote structurele vertekeningen in AI-algoritmen, die deels werden toegeschreven aan het trainen van modellen op oude en bevooroordeelde gegevens. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Bijvoorbeeld de <\/span><a href=\"http:\/\/vis-www.cs.umass.edu\/lfw\/\"><span style=\"font-weight: 400\">Gelabelde gezichten in het wilde huis (LFW)<\/span><\/a><span style=\"font-weight: 400\">, een dataset van gezichten van beroemdheden die vaak wordt gebruikt in gezichtsherkenningstaken, bestaat uit <\/span><a href=\"https:\/\/odsc.medium.com\/the-impact-of-racial-bias-in-facial-recognition-software-36f37113604c\"><span style=\"font-weight: 400\">77,5% mannen en 83,5% blanken<\/span><\/a><span style=\"font-weight: 400\"> individuen. Een AI heeft geen hoop om goed te functioneren als de gegevens niet iedereen vertegenwoordigen die het van dienst wil zijn. Foutpercentages in gezichtsherkenning onder topalgoritmen bleken zo laag te zijn als 0,8% voor blanke mannen en zo hoog als 34,7% voor vrouwen met een donkere huidskleur.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dit onderzoek culmineerde in de mijlpaal <\/span><a href=\"http:\/\/proceedings.mlr.press\/v81\/buolamwini18a\/buolamwini18a.pdf\"><span style=\"font-weight: 400\">Gendertinten studie<\/span><\/a><span style=\"font-weight: 400\"> en een documentaire genaamd <\/span><a href=\"https:\/\/www.netflix.com\/title\/81328723\"><span style=\"font-weight: 400\">Gecodeerde vertekening<\/span><\/a><span style=\"font-weight: 400\">waarin werd onderzocht hoe AI waarschijnlijk leert van gebrekkige en niet-representatieve gegevens.<\/span><\/p>\n<p><span style=\"font-weight: 400\">De gevolgen hiervan zijn verre van goedaardig - dit heeft geleid tot onjuiste uitspraken in rechtszaken, onterechte gevangenisstraffen en vrouwen en andere groepen die banen en kredieten worden geweigerd.<\/span><\/p>\n<p>AI's hebben meer gegevens van hoge kwaliteit nodig, die eerlijk en representatief moeten zijn <span style=\"font-weight: 400\">- het is een ongrijpbare combinatie.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Zijn synthetische gegevens het antwoord?<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Synthetische gegevens worden vaak gebruikt in computer vision (CV), waarbij AI's objecten en kenmerken identificeren uit afbeeldingen en video.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">In plaats van het verzamelen van beeldgegevens uit de echte wereld - zoals het fotograferen of filmen van een straat - wat technisch een uitdaging is en privacyproblemen oplevert, genereer je de gegevens gewoon in een virtuele omgeving.\u00a0<\/span><\/p>\n<figure id=\"attachment_1873\" aria-describedby=\"caption-attachment-1873\" style=\"width: 987px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1873 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models.jpg\" alt=\"\" width=\"987\" height=\"554\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models.jpg 987w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-300x168.jpg 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-768x431.jpg 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-370x208.jpg 370w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-800x449.jpg 800w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-20x11.jpg 20w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-740x415.jpg 740w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-86x48.jpg 86w\" sizes=\"auto, (max-width: 987px) 100vw, 987px\" \/><figcaption id=\"caption-attachment-1873\" class=\"wp-caption-text\">Synthetische gegevens voor training van bestuurderloze auto's. Bron: <a href=\"https:\/\/analyticsindiamag.com\/how-synthetic-data-sets-can-improve-computer-vision-models\/\">Analytics India Mag<\/a>.<\/figcaption><\/figure>\n<p><span style=\"font-weight: 400\">Hoewel dit AI's aanvult met meer gegevens, zijn er verschillende nadelen:\u00a0<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Het modelleren van levensechte scenario's in een virtuele omgeving is niet eenvoudig.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Het genereren van grote hoeveelheden synthetische gegevens is nog steeds kostbaar en tijdrovend.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Randgevallen en uitschieters blijven een probleem.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Het kan het echte werk niet perfect nabootsen.\u00a0<\/span><\/li>\n<li>Aan de andere kant zijn sommige aspecten misschien te perfect en is het moeilijk om te bepalen wat er ontbreekt.<\/li>\n<\/ul>\n<p><span style=\"font-weight: 400\">Uiteindelijk zijn synthetische gegevens uitstekend voor gemakkelijk te virtualiseren omgevingen, zoals een fabrieksvloer, maar niet altijd geschikt voor snel bewegende echte omgevingen zoals een straat in een stad.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Hoe zit het met het genereren van synthetische tekstgegevens?<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Tekst is eenvoudiger dan beeld- of videodata, dus kunnen modellen zoals ChatGPT worden gebruikt om bijna oneindige synthetische trainingsgegevens te genereren?<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ja, maar het is riskant en de gevolgen zijn niet gemakkelijk te voorspellen. <\/span><span style=\"font-weight: 400\">Hoewel synthetische tekstgegevens kunnen helpen bij het afstemmen, testen en optimaliseren van modellen, zijn ze niet ideaal om modellen nieuwe kennis bij te brengen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Hier is een analogie van waarom het trainen van AI's met door AI gegenereerde gegevens problematisch is:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Denk eens aan een school die alle beste schoolboeken ter wereld gebruikt om haar leerlingen in \u00e9\u00e9n dag alles te leren wat er te weten valt.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Daarna begint de school eigen werk te produceren op basis van die kennis - analoog aan de output van een chatbot. Studenten hebben geleerd van alle gegevens die beschikbaar zijn tot de datum waarop de training begint, maar ze kunnen daarna niet effici\u00ebnt nieuwe gegevens in het kennissysteem invoeren.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Kennis wordt dagelijks gecre\u00eberd - terwijl de overgrote meerderheid van de menselijke kennis v\u00f3\u00f3r een specifieke dag werd gecre\u00eberd, evolueert en transformeert kennis in de loop van de tijd. Cruciaal is dat mensen niet alleen voortdurend nieuwe kennis cre\u00ebren - we veranderen ook ons perspectief op bestaande kennis.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Stel nu dat de school, uitgeput van gegevens, haar leerlingen begint te onderwijzen met behulp van haar eigen output. Studenten beginnen hun inhoud op te eten om nieuwe inhoud te produceren.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">In dat stadium slaagt de output van de studenten er niet in zich aan te passen aan de echte wereld en neemt het nut ervan af. Het systeem herkauwt zijn eigen werk. Hoewel het werk zich kan aanpassen en evolueren, doet het dat ge\u00efsoleerd van alles buiten die feedbacklus.\u00a0<\/span><\/li>\n<\/ul>\n<p>AI confronteert mensen voortdurend met raadsels die ze moeten oplossen, en<span style=\"font-weight: 400\">\u00a0<\/span>deze heeft veel <a href=\"https:\/\/www.reddit.com\/r\/ArtificialInteligence\/comments\/14b0p7i\/ai_is_going_to_eat_itself_experiment_shows_people\/\">commenters op Reddit<\/a> en de <a href=\"https:\/\/news.ycombinator.com\/item?id=34889404\">Y Combinator forum<\/a> stomverbaasd.<\/p>\n<p><span style=\"font-weight: 400\">Het is verbijsterend en er is geen echte consensus over de gevolgen.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Menselijke gegevenslabelaars gebruiken vaak AI om gegevens te produceren<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Er is nog een onvoorziene laag in het probleem van het produceren van kwalitatieve trainingsgegevens.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Crowdworking platforms zoals <\/span><a href=\"https:\/\/www.mturk.com\/\"><span style=\"font-weight: 400\">Amazon Mechanische Turk<\/span><\/a><span style=\"font-weight: 400\"> (MTurk) worden regelmatig gebruikt door AI-bedrijven die echte 'menselijke' datasets willen produceren. T<\/span><span style=\"font-weight: 400\">Er bestaat bezorgdheid dat annotators op deze platforms AI's gebruiken om hun taken uit te voeren.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Onderzoekers van de \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL) in Zwitserland analyseerden gegevens van MTurk om te onderzoeken of werknemers AI gebruikten om hun inzendingen te genereren.\u00a0<\/span><\/p>\n<p><a href=\"https:\/\/arxiv.org\/abs\/2306.07899\"><span style=\"font-weight: 400\">De studie<\/span><\/a><span style=\"font-weight: 400\">, gepubliceerd op 13 juni, vroeg 44 MTurk-deelnemers om samenvattingen te maken van 16 medische onderzoekspapers. Uit het onderzoek bleek dat 33% tot 46% van de gebruikers op het platform hun inzendingen met AI genereerden, ondanks dat hen werd gevraagd te reageren in natuurlijke taal.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">\"We ontwikkelden een zeer specifieke methodologie die zeer goed werkte voor het detecteren van synthetische tekst in ons scenario,\" aldus Manoel Ribeiro, co-auteur van het onderzoek en promovendus aan de EPFL, <\/span><a href=\"https:\/\/www.theregister.com\/2023\/06\/16\/crowd_workers_bots_ai_training\/\"><span style=\"font-weight: 400\">vertelde The Register<\/span><\/a><span style=\"font-weight: 400\"> deze week.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Hoewel de dataset en de steekproefgrootte van het onderzoek vrij klein zijn, is het verre van ondenkbaar om te denken dat AI's onbewust worden getraind op AI-gegenereerde inhoud. <\/span><\/p>\n<p><span style=\"font-weight: 400\">De onderzoekers merken op dat lage lonen en repetitief werk bijdragen aan het probleem. AI-bedrijven willen gegevens van topkwaliteit die door mensen zijn gemaakt en tegelijkertijd de kosten laag houden. Een commentator zei op Reddit: \"Ik ben momenteel een van deze werknemers, belast met het trainen van Bard. Ik weet zeker dat ik hiervoor ChatGPT gebruik. 20$\/uur is niet genoeg voor de vreselijke behandeling die we krijgen, dus ik ga elke cent uit deze ******* baan persen.\"<\/span><\/p>\n<p><span style=\"font-weight: 400\">Het konijnenhol wordt nog dieper, omdat AI's vaak worden getraind op gegevens die van het internet zijn gehaald. Naarmate er meer AI-content online wordt gepubliceerd, zal AI onvermijdelijk leren van zijn eigen output.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Nu mensen voor informatie afhankelijk worden van AI's, wordt de kwaliteit van hun output steeds belangrijker. We moeten innovatieve methoden vinden om AI's bij te werken met verse, authentieke gegevens.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Zoals Ribeiro het zegt: \"Menselijke gegevens zijn de gouden standaard, want het zijn mensen waar we om geven, niet grote taalmodellen.\"<\/span><\/p>\n<p><span style=\"font-weight: 400\">Er wordt nog steeds gewerkt aan het analyseren van de potenti\u00eble impact van AI die zijn eigen output consumeert, maar authentieke menselijke gegevens blijven van cruciaal belang voor een groot aantal taken op het gebied van machinaal leren. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Het genereren van enorme hoeveelheden gegevens voor hongerige AI's en het tegelijkertijd omgaan met risico's is een werk in uitvoering.\u00a0<\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Gegevens zijn het levensbloed van AI, maar het is geen oneindige bron. Kan de mensheid zonder gegevens komen te zitten? Wat gebeurt er als dat gebeurt? Complexe AI-modellen vereisen enorme hoeveelheden trainingsgegevens. Voor het trainen van een groot taalmodel (LLM) zoals ChatGPT zijn bijvoorbeeld ongeveer 10 biljoen woorden nodig.  Sommige experts geloven dat de voorraad hoogwaardige gegevens slinkt. In een onderzoek uit 2022 van onderzoekers van verschillende universiteiten staat bijvoorbeeld: \"Onze analyse geeft aan dat de voorraad taalgegevens van hoge kwaliteit binnenkort uitgeput zal zijn; waarschijnlijk voor 2026... Ons werk suggereert dat de huidige trend van steeds groeiende ML-modellen die vertrouwen op enorme hoeveelheden woorden, zal doorzetten.<\/p>","protected":false},"author":2,"featured_media":1874,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[87],"tags":[150,145,160,105],"class_list":["post-1871","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-opinions","tag-ai-benefits","tag-ai-risk","tag-data-science","tag-machine-learning"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>What happens when AI starts consuming its own output? | DailyAI<\/title>\n<meta name=\"description\" content=\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/nl\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\" \/>\n<meta property=\"og:locale\" content=\"nl_NL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"What happens when AI starts consuming its own output? | DailyAI\" \/>\n<meta property=\"og:description\" content=\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/nl\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2023-06-18T22:43:50+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-03-28T00:48:00+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1000\" \/>\n\t<meta property=\"og:image:height\" content=\"667\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Geschreven door\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Geschatte leestijd\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"What happens when AI starts consuming its own output?\",\"datePublished\":\"2023-06-18T22:43:50+00:00\",\"dateModified\":\"2024-03-28T00:48:00+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"},\"wordCount\":1487,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"keywords\":[\"AI benefits\",\"AI risk\",\"Data science\",\"machine learning\"],\"articleSection\":{\"1\":\"Opinions &amp; Analysis\"},\"inLanguage\":\"nl-NL\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\",\"name\":\"What happens when AI starts consuming its own output? | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"datePublished\":\"2023-06-18T22:43:50+00:00\",\"dateModified\":\"2024-03-28T00:48:00+00:00\",\"description\":\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#breadcrumb\"},\"inLanguage\":\"nl-NL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"width\":1000,\"height\":667,\"caption\":\"AI generated data\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"What happens when AI starts consuming its own output?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"nl-NL\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/nl\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wat gebeurt er als AI zijn eigen output begint te consumeren? | DailyAI","description":"Gegevens zijn het levensbloed van AI, maar het is geen oneindige bron. Kan de mensheid zonder gegevens komen te zitten? Wat gebeurt er als dat gebeurt?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/nl\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","og_locale":"nl_NL","og_type":"article","og_title":"What happens when AI starts consuming its own output? | DailyAI","og_description":"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?","og_url":"https:\/\/dailyai.com\/nl\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","og_site_name":"DailyAI","article_published_time":"2023-06-18T22:43:50+00:00","article_modified_time":"2024-03-28T00:48:00+00:00","og_image":[{"width":1000,"height":667,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","type":"image\/jpeg"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Geschreven door":"Sam Jeans","Geschatte leestijd":"7 minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"What happens when AI starts consuming its own output?","datePublished":"2023-06-18T22:43:50+00:00","dateModified":"2024-03-28T00:48:00+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"},"wordCount":1487,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","keywords":["AI benefits","AI risk","Data science","machine learning"],"articleSection":{"1":"Opinions &amp; Analysis"},"inLanguage":"nl-NL"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","url":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","name":"Wat gebeurt er als AI zijn eigen output begint te consumeren? | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","datePublished":"2023-06-18T22:43:50+00:00","dateModified":"2024-03-28T00:48:00+00:00","description":"Gegevens zijn het levensbloed van AI, maar het is geen oneindige bron. Kan de mensheid zonder gegevens komen te zitten? Wat gebeurt er als dat gebeurt?","breadcrumb":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#breadcrumb"},"inLanguage":"nl-NL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"]}]},{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","width":1000,"height":667,"caption":"AI generated data"},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"What happens when AI starts consuming its own output?"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Uw dagelijkse dosis AI-nieuws","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"nl-NL"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/nl\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/posts\/1871","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/comments?post=1871"}],"version-history":[{"count":38,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/posts\/1871\/revisions"}],"predecessor-version":[{"id":2136,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/posts\/1871\/revisions\/2136"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/media\/1874"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/media?parent=1871"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/categories?post=1871"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/nl\/wp-json\/wp\/v2\/tags?post=1871"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}