{"id":1871,"date":"2023-06-18T22:43:50","date_gmt":"2023-06-18T22:43:50","guid":{"rendered":"https:\/\/dailyai.com\/?p=1871"},"modified":"2024-03-28T00:48:00","modified_gmt":"2024-03-28T00:48:00","slug":"what-happens-when-ai-starts-consuming-its-own-output","status":"publish","type":"post","link":"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","title":{"rendered":"Was passiert, wenn KI anf\u00e4ngt, ihren eigenen Output zu konsumieren?"},"content":{"rendered":"<p><strong>Daten sind das Lebenselixier der KI, aber sie sind keine unendliche Ressource. K\u00f6nnen der Menschheit die Daten ausgehen? Was passiert, wenn dies der Fall ist?<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Komplexe KI-Modelle erfordern gro\u00dfe Mengen an Trainingsdaten. F\u00fcr das Training eines gro\u00dfen Sprachmodells (LLM) wie ChatGPT werden zum Beispiel etwa 10 Billionen W\u00f6rter ben\u00f6tigt.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Einige Experten sind der Ansicht, dass das Angebot an hochwertigen Daten schwindet. Eine Studie von Forschern mehrerer Universit\u00e4ten aus dem Jahr 2022 zum Beispiel <a href=\"https:\/\/arxiv.org\/pdf\/2211.04325.pdf\">erkl\u00e4rte<\/a>, <\/span><span style=\"font-weight: 400\">\"Unsere Analyse deutet darauf hin, dass der Bestand an hochwertigen Sprachdaten bald ersch\u00f6pft sein wird, wahrscheinlich vor 2026... Unsere Arbeit deutet darauf hin, dass sich der aktuelle Trend zu immer gr\u00f6\u00dferen ML-Modellen, die auf riesigen Datens\u00e4tzen beruhen, verlangsamen k\u00f6nnte, wenn die Dateneffizienz nicht drastisch verbessert wird oder neue Datenquellen verf\u00fcgbar werden.\"\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Die Generierung synthetischer Daten bietet zwar eine L\u00f6sung, kann aber in der Regel nicht die Tiefe, Nuancierung und Varianz echter Daten erfassen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Um die Situation weiter zu verkomplizieren, gibt es Bedenken dar\u00fcber, was passiert, wenn KI anf\u00e4ngt, ihren eigenen Output zu verbrauchen, was nach Ansicht von Forschern der \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL) in der Schweiz <a href=\"https:\/\/www.theregister.com\/2023\/06\/16\/crowd_workers_bots_ai_training\/\">geschieht bereits<\/a>. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Ihre Untersuchungen deuten darauf hin, dass KI-Unternehmen, die von Menschen produzierte Daten \u00fcber Plattformen wie Amazon Mechanical Turk kaufen, stattdessen m\u00f6glicherweise KI-generierte Daten erhalten.\u00a0<\/span><\/p>\n<p>Was passiert, wenn KI beginnt, ihren eigenen Output zu essen? Kann dies vermieden werden?<\/p>\n<h2><span style=\"font-weight: 400\">Der Aufbau von Datens\u00e4tzen ist teuer und zeitaufw\u00e4ndig - und es steht viel auf dem Spiel<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Daten sind allgegenw\u00e4rtig, aber ihre Operationalisierung f\u00fcr KI ist ein komplexer Prozess. Die Qualit\u00e4t der Daten und Beschriftungen wirkt sich auf die Leistung des Modells aus - es ist ein Fall von \"M\u00fcll rein, M\u00fcll raus\".\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Um den Prozess der Erstellung von Datens\u00e4tzen kurz zu beschreiben: Datenannotatoren (oder Beschrifter) nehmen verarbeitete Daten (z. B. ein ausgeschnittenes Bild) und beschriften <\/span><span style=\"font-weight: 400\">Merkmale (z. B. ein Auto, eine Person, ein Vogel).\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Dadurch erhalten die Algorithmen ein \"Ziel\", von dem sie lernen k\u00f6nnen. Die Algorithmen extrahieren und analysieren Merkmale aus markierten Daten, um diese Merkmale in neuen, ungesehenen Daten vorherzusagen. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Dies ist f\u00fcr das \u00fcberwachte maschinelle Lernen erforderlich, das neben dem un\u00fcberwachten maschinellen Lernen und dem Reinforcement Learning zu den Kernbereichen des maschinellen Lernens geh\u00f6rt. Unter <a href=\"https:\/\/medium.com\/cognilytica\/data-preparation-labeling-for-ai-2020-b512a5ed777c\">einige Sch\u00e4tzungen<\/a>Der Prozess der Datenaufbereitung und -beschriftung nimmt 80% der Projektdauer eines Modells f\u00fcr maschinelles Lernen in Anspruch, aber wenn man zu viele Kompromisse eingeht, besteht die Gefahr, dass die Leistung des Modells beeintr\u00e4chtigt wird. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Neben den praktischen Herausforderungen bei der Erstellung hochwertiger Datens\u00e4tze \u00e4ndert sich auch die Art der Daten selbst st\u00e4ndig. Was man vor 10 Jahren als \"Datensatz mit einer typischen Auswahl an Fahrzeugen im Stra\u00dfenverkehr\" definiert hat, ist heute nicht mehr dasselbe. Heute ist zum Beispiel eine viel gr\u00f6\u00dfere Anzahl von E-Scootern und E-Bikes auf den Stra\u00dfen zu finden.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Diese werden als \"Randf\u00e4lle\" bezeichnet, d. h. seltene Objekte oder Ph\u00e4nomene, die in Datens\u00e4tzen nicht vorkommen.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Modelle spiegeln die Qualit\u00e4t ihrer Datens\u00e4tze wider<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Wenn Sie ein modernes KI-System auf einem alten Datensatz trainieren, besteht die Gefahr, dass das Modell eine geringe Leistung erbringt, wenn es mit neuen, ungesehenen Daten konfrontiert wird.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Zwischen 2015 und 2020 deckten Forscher erhebliche strukturelle Verzerrungen in KI-Algorithmen auf, die zum Teil auf das Training von Modellen mit alten und verzerrten Daten zur\u00fcckzuf\u00fchren waren. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Zum Beispiel, die <\/span><a href=\"http:\/\/vis-www.cs.umass.edu\/lfw\/\"><span style=\"font-weight: 400\">Beschriftete Gesichter im Wilden Heim (LFW)<\/span><\/a><span style=\"font-weight: 400\">ein Datensatz mit prominenten Gesichtern, der h\u00e4ufig f\u00fcr die Gesichtserkennung verwendet wird, besteht aus <\/span><a href=\"https:\/\/odsc.medium.com\/the-impact-of-racial-bias-in-facial-recognition-software-36f37113604c\"><span style=\"font-weight: 400\">77,5%-M\u00e4nner und 83,5%-Wei\u00dfh\u00e4utige<\/span><\/a><span style=\"font-weight: 400\"> Personen. Eine KI hat keine Chance, richtig zu funktionieren, wenn die Daten nicht alle Personen repr\u00e4sentieren, die sie bedienen soll. Die Fehlerquoten der besten Algorithmen bei der Gesichtserkennung lagen bei 0,8% f\u00fcr wei\u00dfe M\u00e4nner und bei 34,7% f\u00fcr dunkelh\u00e4utige Frauen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Diese Forschung gipfelte in dem bahnbrechenden <\/span><a href=\"http:\/\/proceedings.mlr.press\/v81\/buolamwini18a\/buolamwini18a.pdf\"><span style=\"font-weight: 400\">Gender Shades Studie<\/span><\/a><span style=\"font-weight: 400\"> und einen Dokumentarfilm mit dem Titel <\/span><a href=\"https:\/\/www.netflix.com\/title\/81328723\"><span style=\"font-weight: 400\">Codierte Verzerrung<\/span><\/a><span style=\"font-weight: 400\">in der untersucht wurde, wie KI wahrscheinlich aus fehlerhaften und nicht repr\u00e4sentativen Daten lernt.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Die Auswirkungen sind alles andere als harmlos - dies hat zu falschen Gerichtsurteilen, falschen Inhaftierungen und zur Verweigerung von Arbeitspl\u00e4tzen und Krediten f\u00fcr Frauen und andere Gruppen gef\u00fchrt.<\/span><\/p>\n<p>KI ben\u00f6tigt mehr hochwertige Daten, die fair und repr\u00e4sentativ sein m\u00fcssen <span style=\"font-weight: 400\">- Es ist eine schwer zu fassende Kombination.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Sind synthetische Daten die Antwort?<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Synthetische Daten werden h\u00e4ufig in der Computer Vision (CV) verwendet, wo KI Objekte und Merkmale aus Bildern und Videos identifizieren.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Anstatt Bilddaten in der realen Welt zu sammeln - wie z. B. das Fotografieren oder Filmen einer Stra\u00dfe -, was eine technische Herausforderung darstellt und Probleme mit dem Datenschutz mit sich bringt, werden die Daten einfach in einer virtuellen Umgebung erzeugt.\u00a0<\/span><\/p>\n<figure id=\"attachment_1873\" aria-describedby=\"caption-attachment-1873\" style=\"width: 987px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1873 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models.jpg\" alt=\"\" width=\"987\" height=\"554\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models.jpg 987w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-300x168.jpg 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-768x431.jpg 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-370x208.jpg 370w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-800x449.jpg 800w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-20x11.jpg 20w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-740x415.jpg 740w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-86x48.jpg 86w\" sizes=\"auto, (max-width: 987px) 100vw, 987px\" \/><figcaption id=\"caption-attachment-1873\" class=\"wp-caption-text\">Synthetische Daten f\u00fcr das Training fahrerloser Autos. Quelle: <a href=\"https:\/\/analyticsindiamag.com\/how-synthetic-data-sets-can-improve-computer-vision-models\/\">Analytik Indien Mag<\/a>.<\/figcaption><\/figure>\n<p><span style=\"font-weight: 400\">Dies erg\u00e4nzt die KI zwar um mehr Daten, hat aber auch einige Nachteile:\u00a0<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Es ist nicht einfach, reale Szenarien in einer virtuellen Umgebung zu modellieren.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Die Erzeugung gro\u00dfer Mengen synthetischer Daten ist nach wie vor kostspielig und zeitaufw\u00e4ndig.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Grenzf\u00e4lle und Ausrei\u00dfer bleiben ein Problem.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Es kann die Realit\u00e4t nicht perfekt nachbilden.\u00a0<\/span><\/li>\n<li>Andererseits k\u00f6nnten einige Aspekte zu perfekt sein, und es ist schwierig festzustellen, was noch fehlt.<\/li>\n<\/ul>\n<p><span style=\"font-weight: 400\">Synthetische Daten eignen sich hervorragend f\u00fcr leicht zu virtualisierende Umgebungen, wie z. B. eine Fabrikhalle, aber nicht immer f\u00fcr schnelllebige reale Umgebungen wie eine Stra\u00dfe.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Wie steht es mit der Erzeugung synthetischer Textdaten?<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Text ist einfacher als Bild- oder Videodaten. K\u00f6nnen also Modelle wie ChatGPT verwendet werden, um nahezu unbegrenzte synthetische Trainingsdaten zu erzeugen?<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ja, aber es ist riskant, und die Auswirkungen sind nicht leicht vorherzusagen. <\/span><span style=\"font-weight: 400\">Synthetische Textdaten k\u00f6nnen zwar beim Abstimmen, Testen und Optimieren von Modellen helfen, sind aber nicht ideal, um Modellen neues Wissen beizubringen, und k\u00f6nnten Verzerrungen und andere Probleme verst\u00e4rken.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Hier eine Analogie, warum das Training von KI mit KI-generierten Daten problematisch ist:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Stellen Sie sich eine Schule vor, die mit den besten Lehrb\u00fcchern der Welt arbeitet, um ihren Sch\u00fclern innerhalb eines Tages alles zu vermitteln, was sie aus ihren Ressourcen wissen m\u00fcssen.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Danach beginnt die Schule, auf der Grundlage dieses Wissens ihre eigene Arbeit zu produzieren - analog zum Output eines Chatbots. Die Sch\u00fcler haben aus allen Daten gelernt, die bis zum Beginn der Ausbildung verf\u00fcgbar waren, aber sie k\u00f6nnen danach keine neuen Daten mehr effizient in das Wissenssystem einspeisen.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Wissen wird t\u00e4glich neu geschaffen - w\u00e4hrend der Gro\u00dfteil des menschlichen Wissens vor einem bestimmten Tag geschaffen wurde, entwickelt sich das Wissen im Laufe der Zeit weiter und ver\u00e4ndert sich. Entscheidend ist, dass wir Menschen nicht nur st\u00e4ndig neues Wissen schaffen, sondern auch unsere Sichtweise auf vorhandenes Wissen \u00e4ndern.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Nehmen wir nun an, dass die Schule, die keine Daten mehr hat, damit beginnt, ihre Sch\u00fcler anhand ihrer eigenen Ergebnisse zu unterrichten. Die Sch\u00fcler beginnen, ihre Inhalte zu \"fressen\", um neue Inhalte zu produzieren.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">In diesem Stadium passt sich der Output der Sch\u00fcler nicht mehr an die reale Welt an und sein Nutzen nimmt ab. Das System erbricht seine eigene Arbeit. Die Arbeit kann sich zwar anpassen und weiterentwickeln, aber sie tut dies isoliert von allem, was au\u00dferhalb dieser R\u00fcckkopplungsschleife liegt.\u00a0<\/span><\/li>\n<\/ul>\n<p>Die KI stellt die Menschen st\u00e4ndig vor R\u00e4tsel, die es zu l\u00f6sen gilt, und<span style=\"font-weight: 400\">\u00a0<\/span>diese hat eine Menge von <a href=\"https:\/\/www.reddit.com\/r\/ArtificialInteligence\/comments\/14b0p7i\/ai_is_going_to_eat_itself_experiment_shows_people\/\">Kommentatoren auf Reddit<\/a> und die <a href=\"https:\/\/news.ycombinator.com\/item?id=34889404\">Y Combinator-Forum<\/a> verbl\u00fcfft.<\/p>\n<p><span style=\"font-weight: 400\">Das ist eine verbl\u00fcffende Sache, und es gibt keinen wirklichen Konsens \u00fcber die Auswirkungen.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Menschliche Datenbeschrifter nutzen oft KI, um Daten zu erstellen<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Es gibt noch eine weitere, unvorhergesehene Ebene des Problems, qualitativ hochwertige Trainingsdaten zu erzeugen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Crowdworking-Plattformen wie <\/span><a href=\"https:\/\/www.mturk.com\/\"><span style=\"font-weight: 400\">Amazon Mechanical Turk<\/span><\/a><span style=\"font-weight: 400\"> (MTurk) werden regelm\u00e4\u00dfig von KI-Unternehmen genutzt, die echte \"menschliche\" Datens\u00e4tze erstellen wollen. T<\/span><span style=\"font-weight: 400\">Es besteht die Bef\u00fcrchtung, dass Datenkommentatoren auf diesen Plattformen KI einsetzen, um ihre Aufgaben zu erf\u00fcllen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Forscher der \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL) in der Schweiz analysierten Daten, die \u00fcber MTurk erstellt wurden, um herauszufinden, ob Arbeitnehmer KI zur Erstellung ihrer Beitr\u00e4ge verwendeten.\u00a0<\/span><\/p>\n<p><a href=\"https:\/\/arxiv.org\/abs\/2306.07899\"><span style=\"font-weight: 400\">Die Studie<\/span><\/a><span style=\"font-weight: 400\">die am 13. Juni ver\u00f6ffentlicht wurde, beauftragte 44 MTurk-Teilnehmer damit, die Zusammenfassungen von 16 medizinischen Forschungsarbeiten zusammenzufassen. Dabei wurde festgestellt, dass 33% bis 46% der Nutzer auf der Plattform ihre Beitr\u00e4ge mit KI erstellten, obwohl sie aufgefordert wurden, in nat\u00fcrlicher Sprache zu antworten.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">\"Wir haben eine sehr spezifische Methode entwickelt, die in unserem Szenario sehr gut f\u00fcr die Erkennung von synthetischem Text funktioniert\", erkl\u00e4rt Manoel Ribeiro, Mitautor der Studie und Doktorand an der EPFL, <\/span><a href=\"https:\/\/www.theregister.com\/2023\/06\/16\/crowd_workers_bots_ai_training\/\"><span style=\"font-weight: 400\">gegen\u00fcber The Register<\/span><\/a><span style=\"font-weight: 400\"> diese Woche.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Auch wenn der Datensatz und die Stichprobengr\u00f6\u00dfe der Studie recht klein sind, ist es durchaus denkbar, dass KI unwissentlich auf KI-generierte Inhalte trainiert wird. <\/span><\/p>\n<p><span style=\"font-weight: 400\">In der Studie geht es nicht darum, den MTurk-Mitarbeitern die Schuld zu geben - die Forscher weisen darauf hin, dass niedrige L\u00f6hne und repetitive Arbeit zu diesem Problem beitragen. KI-Unternehmen wollen qualitativ hochwertige, von Menschen erstellte Daten und gleichzeitig die Kosten niedrig halten. Ein Kommentator sagte auf Reddit: \"Ich bin derzeit einer dieser Arbeiter, der Bard trainieren soll. Ich benutze daf\u00fcr ganz sicher ChatGPT. 20$\/Std. ist nicht genug f\u00fcr die schreckliche Behandlung, die wir bekommen, also werde ich jeden Cent aus diesem ******* Job herausquetschen.\"<\/span><\/p>\n<p><span style=\"font-weight: 400\">Der Kaninchenbau wird sogar noch tiefer, da KI oft auf Daten trainiert wird, die aus dem Internet stammen. Da immer mehr von KI geschriebene Inhalte online ver\u00f6ffentlicht werden, wird die KI unweigerlich aus ihren eigenen Ergebnissen lernen.<\/span><\/p>\n<p><span style=\"font-weight: 400\">In dem Ma\u00dfe, in dem sich die Menschen bei der Informationsbeschaffung auf KI verlassen, wird die Qualit\u00e4t ihrer Ergebnisse immer wichtiger. Wir m\u00fcssen innovative Methoden finden, um KIs mit frischen, authentischen Daten zu versorgen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ribeiro sagt: \"Menschliche Daten sind der Goldstandard, denn wir interessieren uns f\u00fcr Menschen, nicht f\u00fcr gro\u00dfe Sprachmodelle.\"<\/span><\/p>\n<p><span style=\"font-weight: 400\">Die Arbeiten zur Analyse der potenziellen Auswirkungen von KI, die ihre eigenen Ergebnisse konsumiert, sind noch nicht abgeschlossen, aber authentische menschliche Daten sind nach wie vor von entscheidender Bedeutung f\u00fcr eine breite Palette von Aufgaben des maschinellen Lernens. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Die Generierung riesiger Datenmengen f\u00fcr hungrige KI bei gleichzeitiger Beherrschung der Risiken ist eine Aufgabe, die noch nicht abgeschlossen ist.\u00a0<\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Daten sind das Lebenselixier der KI, aber sie sind keine unendliche Ressource. K\u00f6nnen der Menschheit die Daten ausgehen? Was passiert, wenn dies der Fall ist? Komplexe KI-Modelle erfordern gro\u00dfe Mengen an Trainingsdaten. F\u00fcr das Training eines gro\u00dfen Sprachmodells (LLM) wie ChatGPT werden zum Beispiel etwa 10 Billionen W\u00f6rter ben\u00f6tigt.  Einige Experten sind der Meinung, dass das Angebot an hochwertigen Daten schwindet. So hei\u00dft es in einer Studie von Forschern mehrerer Universit\u00e4ten aus dem Jahr 2022: \"Unsere Analyse deutet darauf hin, dass der Bestand an hochwertigen Sprachdaten bald ersch\u00f6pft sein wird, wahrscheinlich noch vor 2026... Unsere Arbeit deutet darauf hin, dass der derzeitige Trend zu immer gr\u00f6\u00dfer werdenden ML-Modellen, die sich auf enorme<\/p>","protected":false},"author":2,"featured_media":1874,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[87],"tags":[150,145,160,105],"class_list":["post-1871","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-opinions","tag-ai-benefits","tag-ai-risk","tag-data-science","tag-machine-learning"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>What happens when AI starts consuming its own output? | DailyAI<\/title>\n<meta name=\"description\" content=\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"What happens when AI starts consuming its own output? | DailyAI\" \/>\n<meta property=\"og:description\" content=\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2023-06-18T22:43:50+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-03-28T00:48:00+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1000\" \/>\n\t<meta property=\"og:image:height\" content=\"667\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"7\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"What happens when AI starts consuming its own output?\",\"datePublished\":\"2023-06-18T22:43:50+00:00\",\"dateModified\":\"2024-03-28T00:48:00+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"},\"wordCount\":1487,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"keywords\":[\"AI benefits\",\"AI risk\",\"Data science\",\"machine learning\"],\"articleSection\":{\"1\":\"Opinions &amp; Analysis\"},\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\",\"name\":\"What happens when AI starts consuming its own output? | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"datePublished\":\"2023-06-18T22:43:50+00:00\",\"dateModified\":\"2024-03-28T00:48:00+00:00\",\"description\":\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"width\":1000,\"height\":667,\"caption\":\"AI generated data\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"What happens when AI starts consuming its own output?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/de\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Was passiert, wenn KI anf\u00e4ngt, ihren eigenen Output zu konsumieren? | DailyAI","description":"Daten sind das Lebenselixier der KI, aber sie sind keine unendliche Ressource. K\u00f6nnen der Menschheit die Daten ausgehen? Was passiert, wenn dies der Fall ist?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","og_locale":"de_DE","og_type":"article","og_title":"What happens when AI starts consuming its own output? | DailyAI","og_description":"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?","og_url":"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","og_site_name":"DailyAI","article_published_time":"2023-06-18T22:43:50+00:00","article_modified_time":"2024-03-28T00:48:00+00:00","og_image":[{"width":1000,"height":667,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","type":"image\/jpeg"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Verfasst von":"Sam Jeans","Gesch\u00e4tzte Lesezeit":"7\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"What happens when AI starts consuming its own output?","datePublished":"2023-06-18T22:43:50+00:00","dateModified":"2024-03-28T00:48:00+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"},"wordCount":1487,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","keywords":["AI benefits","AI risk","Data science","machine learning"],"articleSection":{"1":"Opinions &amp; Analysis"},"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","url":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","name":"Was passiert, wenn KI anf\u00e4ngt, ihren eigenen Output zu konsumieren? | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","datePublished":"2023-06-18T22:43:50+00:00","dateModified":"2024-03-28T00:48:00+00:00","description":"Daten sind das Lebenselixier der KI, aber sie sind keine unendliche Ressource. K\u00f6nnen der Menschheit die Daten ausgehen? Was passiert, wenn dies der Fall ist?","breadcrumb":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","width":1000,"height":667,"caption":"AI generated data"},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"What happens when AI starts consuming its own output?"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Ihre t\u00e4gliche Dosis an AI-Nachrichten","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/de\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/1871","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/comments?post=1871"}],"version-history":[{"count":38,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/1871\/revisions"}],"predecessor-version":[{"id":2136,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/1871\/revisions\/2136"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media\/1874"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media?parent=1871"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/categories?post=1871"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/tags?post=1871"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}