{"id":1871,"date":"2023-06-18T22:43:50","date_gmt":"2023-06-18T22:43:50","guid":{"rendered":"https:\/\/dailyai.com\/?p=1871"},"modified":"2024-03-28T00:48:00","modified_gmt":"2024-03-28T00:48:00","slug":"what-happens-when-ai-starts-consuming-its-own-output","status":"publish","type":"post","link":"https:\/\/dailyai.com\/fr\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","title":{"rendered":"Que se passera-t-il lorsque l'IA commencera \u00e0 consommer sa propre production ?"},"content":{"rendered":"<p><strong>Les donn\u00e9es sont l'\u00e9l\u00e9ment vital de l'IA, mais elles ne constituent pas une ressource infinie. L'humanit\u00e9 peut-elle manquer de donn\u00e9es ? Que se passera-t-il si c'est le cas ?<\/strong><\/p>\n<p><span style=\"font-weight: 400\">Les mod\u00e8les d'IA complexes n\u00e9cessitent de grandes quantit\u00e9s de donn\u00e9es d'apprentissage. Par exemple, l'entra\u00eenement d'un grand mod\u00e8le linguistique (LLM) comme ChatGPT n\u00e9cessite environ 10 000 milliards de mots.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Certains experts estiment que l'offre de donn\u00e9es de haute qualit\u00e9 s'amenuise. Par exemple, une \u00e9tude r\u00e9alis\u00e9e en 2022 par des chercheurs de plusieurs universit\u00e9s <a href=\"https:\/\/arxiv.org\/pdf\/2211.04325.pdf\">d\u00e9clar\u00e9e<\/a>, <\/span><span style=\"font-weight: 400\">\"Notre analyse indique que le stock de donn\u00e9es linguistiques de haute qualit\u00e9 sera bient\u00f4t \u00e9puis\u00e9, probablement avant 2026... Notre travail sugg\u00e8re que la tendance actuelle \u00e0 la croissance constante des mod\u00e8les ML qui reposent sur d'\u00e9normes ensembles de donn\u00e9es pourrait ralentir si l'efficacit\u00e9 des donn\u00e9es n'est pas radicalement am\u00e9lior\u00e9e ou si de nouvelles sources de donn\u00e9es ne deviennent pas disponibles.\"\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Si la production de donn\u00e9es synth\u00e9tiques constitue une solution, elle ne permet g\u00e9n\u00e9ralement pas de saisir la profondeur, la nuance et la variance des donn\u00e9es r\u00e9elles.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour compliquer encore la situation, on s'interroge sur ce qui se passera lorsque l'IA commencera \u00e0 consommer sa propre production, ce que les chercheurs de l'\u00c9cole polytechnique f\u00e9d\u00e9rale de Lausanne (EPFL), en Suisse, estiment \u00eatre le cas. <a href=\"https:\/\/www.theregister.com\/2023\/06\/16\/crowd_workers_bots_ai_training\/\">d\u00e9j\u00e0 en cours<\/a>. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Leur recherche indique que les entreprises d'IA qui ach\u00e8tent des donn\u00e9es produites par des humains sur des plateformes telles qu'Amazon Mechanical Turk pourraient recevoir des donn\u00e9es g\u00e9n\u00e9r\u00e9es par l'IA \u00e0 la place.\u00a0<\/span><\/p>\n<p>Que se passe-t-il lorsque l'IA commence \u00e0 manger sa propre production ? Peut-on l'\u00e9viter ?<\/p>\n<h2><span style=\"font-weight: 400\">La constitution d'ensembles de donn\u00e9es est co\u00fbteuse et prend du temps - et les enjeux sont importants<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Les donn\u00e9es sont omnipr\u00e9sentes, mais les rendre op\u00e9rationnelles pour l'IA est un processus complexe. La qualit\u00e9 des donn\u00e9es et des \u00e9tiquettes influe sur les performances du mod\u00e8le.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Pour d\u00e9crire bri\u00e8vement le processus de constitution des ensembles de donn\u00e9es, les annotateurs de donn\u00e9es (ou \u00e9tiqueteurs) prennent des donn\u00e9es trait\u00e9es (par exemple, une image recadr\u00e9e) et les \u00e9tiquettent. <\/span><span style=\"font-weight: 400\">(par exemple, une voiture, une personne, un oiseau).\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les algorithmes disposent ainsi d'une \"cible\" \u00e0 partir de laquelle ils peuvent apprendre. Les algorithmes extraient et analysent les caract\u00e9ristiques des donn\u00e9es \u00e9tiquet\u00e9es afin de pr\u00e9dire ces caract\u00e9ristiques dans de nouvelles donn\u00e9es in\u00e9dites. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Cela est n\u00e9cessaire pour l'apprentissage automatique supervis\u00e9, qui est l'une des branches principales de l'apprentissage automatique, avec l'apprentissage automatique non supervis\u00e9 et l'apprentissage par renforcement. Par <a href=\"https:\/\/medium.com\/cognilytica\/data-preparation-labeling-for-ai-2020-b512a5ed777c\">quelques estimations<\/a>Le processus de pr\u00e9paration et d'\u00e9tiquetage des donn\u00e9es occupe 80% de la dur\u00e9e d'un projet de mod\u00e8le d'apprentissage automatique, mais si l'on prend trop de risques, on risque de compromettre les performances d'un mod\u00e8le. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Outre les d\u00e9fis pratiques li\u00e9s \u00e0 la cr\u00e9ation d'ensembles de donn\u00e9es de haute qualit\u00e9, la nature m\u00eame des donn\u00e9es \u00e9volue constamment. Ce que l'on d\u00e9finissait comme un \"ensemble de donn\u00e9es contenant une s\u00e9lection typique de v\u00e9hicules sur la route\" il y a dix ans n'est plus la m\u00eame chose aujourd'hui. Aujourd'hui, on trouve un nombre beaucoup plus important de scooters et de v\u00e9los \u00e9lectriques sur les routes, par exemple.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Il s'agit de \"cas marginaux\", c'est-\u00e0-dire d'objets ou de ph\u00e9nom\u00e8nes rares qui ne sont pas pr\u00e9sents dans les ensembles de donn\u00e9es.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Les mod\u00e8les refl\u00e8tent la qualit\u00e9 de leurs ensembles de donn\u00e9es<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Si vous entra\u00eenez un syst\u00e8me d'IA moderne sur un ancien ensemble de donn\u00e9es, le mod\u00e8le risque d'\u00eatre peu performant lorsqu'il sera expos\u00e9 \u00e0 de nouvelles donn\u00e9es in\u00e9dites.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Entre 2015 et 2020, des chercheurs ont mis au jour des biais structurels majeurs dans les algorithmes d'IA, en partie attribu\u00e9s \u00e0 l'entra\u00eenement des mod\u00e8les sur des donn\u00e9es anciennes et biais\u00e9es. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Par exemple, le <\/span><a href=\"http:\/\/vis-www.cs.umass.edu\/lfw\/\"><span style=\"font-weight: 400\">Visages \u00e9tiquet\u00e9s dans la maison sauvage (LFW)<\/span><\/a><span style=\"font-weight: 400\">La base de donn\u00e9es des visages de c\u00e9l\u00e9brit\u00e9s, couramment utilis\u00e9e dans les t\u00e2ches de reconnaissance faciale, se compose des \u00e9l\u00e9ments suivants <\/span><a href=\"https:\/\/odsc.medium.com\/the-impact-of-racial-bias-in-facial-recognition-software-36f37113604c\"><span style=\"font-weight: 400\">77,5% hommes et 83,5% peau blanche<\/span><\/a><span style=\"font-weight: 400\"> des individus. Une IA n'a aucune chance de fonctionner correctement si les donn\u00e9es ne repr\u00e9sentent pas toutes les personnes qu'elle est cens\u00e9e servir. Les taux d'erreur de reconnaissance faciale des meilleurs algorithmes se sont r\u00e9v\u00e9l\u00e9s aussi bas que 0,8% pour les hommes blancs et aussi \u00e9lev\u00e9s que 34,7% pour les femmes \u00e0 la peau fonc\u00e9e.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Ces recherches ont abouti \u00e0 la publication de l'ouvrage de r\u00e9f\u00e9rence <\/span><a href=\"http:\/\/proceedings.mlr.press\/v81\/buolamwini18a\/buolamwini18a.pdf\"><span style=\"font-weight: 400\">\u00c9tude sur les nuances de genre<\/span><\/a><span style=\"font-weight: 400\"> et un documentaire intitul\u00e9 <\/span><a href=\"https:\/\/www.netflix.com\/title\/81328723\"><span style=\"font-weight: 400\">Biais cod\u00e9<\/span><\/a><span style=\"font-weight: 400\">qui \u00e9tudie la mani\u00e8re dont l'IA apprend probablement \u00e0 partir de donn\u00e9es erron\u00e9es et non repr\u00e9sentatives.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les cons\u00e9quences sont loin d'\u00eatre anodines - cela a conduit \u00e0 des d\u00e9cisions judiciaires erron\u00e9es, \u00e0 des emprisonnements injustifi\u00e9s et \u00e0 l'exclusion des femmes et d'autres groupes de l'emploi et du cr\u00e9dit.<\/span><\/p>\n<p>Les IA ont besoin de davantage de donn\u00e9es de haute qualit\u00e9, qui doivent \u00eatre \u00e9quitables et repr\u00e9sentatives <span style=\"font-weight: 400\">- c'est une combinaison insaisissable.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Les donn\u00e9es synth\u00e9tiques sont-elles la solution ?<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Les donn\u00e9es synth\u00e9tiques sont couramment utilis\u00e9es dans le domaine de la vision artificielle, o\u00f9 les IA identifient des objets et des caract\u00e9ristiques \u00e0 partir d'images et de vid\u00e9os.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Au lieu de collecter des donn\u00e9es d'image dans le monde r\u00e9el - comme photographier ou filmer une rue - ce qui est techniquement difficile et pose des probl\u00e8mes de confidentialit\u00e9, vous g\u00e9n\u00e9rez simplement les donn\u00e9es dans un environnement virtuel.\u00a0<\/span><\/p>\n<figure id=\"attachment_1873\" aria-describedby=\"caption-attachment-1873\" style=\"width: 987px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1873 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models.jpg\" alt=\"\" width=\"987\" height=\"554\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models.jpg 987w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-300x168.jpg 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-768x431.jpg 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-370x208.jpg 370w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-800x449.jpg 800w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-20x11.jpg 20w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-740x415.jpg 740w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/computer-vision-models-86x48.jpg 86w\" sizes=\"auto, (max-width: 987px) 100vw, 987px\" \/><figcaption id=\"caption-attachment-1873\" class=\"wp-caption-text\">Donn\u00e9es synth\u00e9tiques pour la formation \u00e0 la conduite automobile sans conducteur. Source : <a href=\"https:\/\/analyticsindiamag.com\/how-synthetic-data-sets-can-improve-computer-vision-models\/\">Analytics India Mag<\/a>.<\/figcaption><\/figure>\n<p><span style=\"font-weight: 400\">Bien que cela permette aux IA de disposer de plus de donn\u00e9es, il y a plusieurs inconv\u00e9nients :\u00a0<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Mod\u00e9liser des sc\u00e9narios r\u00e9els dans un environnement virtuel n'est pas simple.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">La production de grandes quantit\u00e9s de donn\u00e9es synth\u00e9tiques est encore co\u00fbteuse et prend du temps.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Les cas limites et les valeurs aberrantes restent un probl\u00e8me.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Il ne peut pas reproduire parfaitement la r\u00e9alit\u00e9.\u00a0<\/span><\/li>\n<li>D'autre part, certains aspects peuvent \u00eatre trop parfaits et il est difficile de d\u00e9terminer ce qui manque.<\/li>\n<\/ul>\n<p><span style=\"font-weight: 400\">En fin de compte, les donn\u00e9es synth\u00e9tiques sont excellentes pour les environnements facilement virtualis\u00e9s, comme une usine, mais ne sont pas toujours adapt\u00e9es aux environnements r\u00e9els en mouvement rapide, comme les rues d'une ville.<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Qu'en est-il de la g\u00e9n\u00e9ration de donn\u00e9es textuelles synth\u00e9tiques ?<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Le texte est plus simple que les images ou les donn\u00e9es vid\u00e9o. Des mod\u00e8les comme ChatGPT peuvent-ils \u00eatre utilis\u00e9s pour g\u00e9n\u00e9rer des donn\u00e9es d'entra\u00eenement synth\u00e9tiques quasi infinies ?<\/span><\/p>\n<p><span style=\"font-weight: 400\">Oui, mais c'est risqu\u00e9 et les cons\u00e9quences ne sont pas faciles \u00e0 pr\u00e9voir. <\/span><span style=\"font-weight: 400\">Si les donn\u00e9es textuelles synth\u00e9tiques peuvent aider \u00e0 ajuster, tester et optimiser les mod\u00e8les, elles ne sont pas id\u00e9ales pour enseigner de nouvelles connaissances aux mod\u00e8les et risquent de renforcer les pr\u00e9jug\u00e9s et d'autres probl\u00e8mes.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Voici une analogie qui montre pourquoi la formation d'IA avec des donn\u00e9es g\u00e9n\u00e9r\u00e9es par l'IA est probl\u00e9matique :<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Prenons l'exemple d'une \u00e9cole qui utilise tous les meilleurs manuels du monde pour former ses \u00e9tudiants \u00e0 tout ce qu'il faut savoir \u00e0 partir de ses ressources en l'espace d'une journ\u00e9e.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Ensuite, l'\u00e9cole commence \u00e0 produire son propre travail sur la base de ces connaissances, \u00e0 l'instar de la production d'un chatbot. Les \u00e9tudiants ont appris \u00e0 partir de toutes les donn\u00e9es disponibles \u00e0 la date du d\u00e9but de la formation, mais ils ne peuvent pas int\u00e9grer efficacement de nouvelles donn\u00e9es dans le syst\u00e8me de connaissances par la suite.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">La connaissance est cr\u00e9\u00e9e chaque jour - alors que la grande majorit\u00e9 des connaissances humaines ont \u00e9t\u00e9 cr\u00e9\u00e9es avant un jour pr\u00e9cis, la connaissance \u00e9volue et se transforme au fil du temps. Fait essentiel, les humains ne se contentent pas de cr\u00e9er constamment de nouvelles connaissances, ils changent \u00e9galement de point de vue sur les connaissances existantes.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Supposons maintenant que l'\u00e9cole, \u00e0 court de donn\u00e9es, commence \u00e0 enseigner \u00e0 ses \u00e9l\u00e8ves en utilisant sa propre production. Les \u00e9l\u00e8ves commencent \u00e0 \"manger\" leur contenu pour en produire un nouveau.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">\u00c0 ce stade, la production des \u00e9tudiants ne s'adapte pas au monde r\u00e9el et son utilit\u00e9 diminue. Le syst\u00e8me r\u00e9gurgite son propre travail. Bien que le travail puisse s'adapter et \u00e9voluer, il le fait de mani\u00e8re isol\u00e9e par rapport \u00e0 tout ce qui se trouve en dehors de cette boucle de r\u00e9troaction.\u00a0<\/span><\/li>\n<\/ul>\n<p>L'IA confronte constamment les gens \u00e0 des \u00e9nigmes \u00e0 r\u00e9soudre.<span style=\"font-weight: 400\">\u00a0<\/span>celui-ci a beaucoup de <a href=\"https:\/\/www.reddit.com\/r\/ArtificialInteligence\/comments\/14b0p7i\/ai_is_going_to_eat_itself_experiment_shows_people\/\">les commentateurs sur Reddit<\/a> et le <a href=\"https:\/\/news.ycombinator.com\/item?id=34889404\">Forum Y Combinator<\/a> perplexe.<\/p>\n<p><span style=\"font-weight: 400\">C'est un sujet d\u00e9routant, et il n'y a pas de v\u00e9ritable consensus sur les ramifications.\u00a0<\/span><\/p>\n<h2><span style=\"font-weight: 400\">Les \u00e9tiqueteurs de donn\u00e9es humains utilisent souvent l'IA pour produire des donn\u00e9es<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Le probl\u00e8me de la production de donn\u00e9es de formation de qualit\u00e9 comporte un autre aspect impr\u00e9vu.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Les plateformes de crowdworking telles que <\/span><a href=\"https:\/\/www.mturk.com\/\"><span style=\"font-weight: 400\">Amazon Mechanical Turk<\/span><\/a><span style=\"font-weight: 400\"> (MTurk) sont r\u00e9guli\u00e8rement utilis\u00e9s par les entreprises d'IA qui cherchent \u00e0 produire de v\u00e9ritables ensembles de donn\u00e9es \"humaines\". T<\/span><span style=\"font-weight: 400\">Il est \u00e0 craindre que les annotateurs de donn\u00e9es sur ces plateformes utilisent des IA pour accomplir leurs t\u00e2ches.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Des chercheurs de l'\u00c9cole polytechnique f\u00e9d\u00e9rale de Lausanne (EPFL), en Suisse, ont analys\u00e9 les donn\u00e9es cr\u00e9\u00e9es par MTurk pour d\u00e9terminer si les travailleurs utilisaient l'IA pour g\u00e9n\u00e9rer leurs soumissions.\u00a0<\/span><\/p>\n<p><a href=\"https:\/\/arxiv.org\/abs\/2306.07899\"><span style=\"font-weight: 400\">L'\u00e9tude<\/span><\/a><span style=\"font-weight: 400\">publi\u00e9e le 13 juin, a demand\u00e9 \u00e0 44 participants de MTurk de r\u00e9sumer les r\u00e9sum\u00e9s de 16 articles de recherche m\u00e9dicale. L'\u00e9tude a r\u00e9v\u00e9l\u00e9 que 33% \u00e0 46% des utilisateurs de la plateforme ont g\u00e9n\u00e9r\u00e9 leurs soumissions \u00e0 l'aide de l'IA, bien qu'il leur ait \u00e9t\u00e9 demand\u00e9 de r\u00e9pondre en langage naturel.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">\"Nous avons mis au point une m\u00e9thodologie tr\u00e8s sp\u00e9cifique qui a tr\u00e8s bien fonctionn\u00e9 pour d\u00e9tecter les textes synth\u00e9tiques dans notre sc\u00e9nario\", explique Manoel Ribeiro, co-auteur de l'\u00e9tude et doctorant \u00e0 l'EPFL, <\/span><a href=\"https:\/\/www.theregister.com\/2023\/06\/16\/crowd_workers_bots_ai_training\/\"><span style=\"font-weight: 400\">a d\u00e9clar\u00e9 \u00e0 The Register<\/span><\/a><span style=\"font-weight: 400\"> cette semaine.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Bien que l'ensemble des donn\u00e9es et l'\u00e9chantillon de l'\u00e9tude soient assez restreints, il est loin d'\u00eatre inconcevable de penser que les IA sont entra\u00een\u00e9es \u00e0 leur insu sur du contenu g\u00e9n\u00e9r\u00e9 par l'IA. <\/span><\/p>\n<p><span style=\"font-weight: 400\">L'\u00e9tude ne vise pas \u00e0 bl\u00e2mer les travailleurs de MTurk - les chercheurs notent que les bas salaires et le travail r\u00e9p\u00e9titif contribuent au probl\u00e8me. Les entreprises sp\u00e9cialis\u00e9es dans l'IA veulent des donn\u00e9es cr\u00e9\u00e9es par des humains de la meilleure qualit\u00e9 possible tout en maintenant les co\u00fbts \u00e0 un niveau bas. Un commentateur a d\u00e9clar\u00e9 sur Reddit : \"Je suis actuellement l'un de ces travailleurs, charg\u00e9 de former Bard. Je suis certain d'utiliser ChatGPT pour cela. 20$\/h n'est pas suffisant pour l'horrible traitement que nous recevons, alors je vais tirer chaque centime de ce travail *******.\"<\/span><\/p>\n<p><span style=\"font-weight: 400\">Le trou du lapin est encore plus profond, car les IA sont souvent form\u00e9es \u00e0 partir de donn\u00e9es extraites de l'internet. Comme de plus en plus de contenus r\u00e9dig\u00e9s par l'IA sont publi\u00e9s en ligne, l'IA apprendra in\u00e9vitablement \u00e0 partir de ses propres r\u00e9sultats.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Alors que les humains commencent \u00e0 d\u00e9pendre des IA pour obtenir des informations, la qualit\u00e9 de leurs r\u00e9sultats devient de plus en plus critique. Nous devons trouver des m\u00e9thodes innovantes pour mettre \u00e0 jour les IA avec des donn\u00e9es fra\u00eeches et authentiques.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400\">Comme l'explique M. Ribeiro, \"les donn\u00e9es humaines constituent l'\u00e9talon-or, car ce sont les \u00eatres humains qui nous int\u00e9ressent, et non les grands mod\u00e8les de langage\".<\/span><\/p>\n<p><span style=\"font-weight: 400\">Le travail d'analyse de l'impact potentiel de l'IA consommant ses propres r\u00e9sultats est en cours, mais les donn\u00e9es humaines authentiques restent essentielles pour un large \u00e9ventail de t\u00e2ches d'apprentissage automatique. <\/span><\/p>\n<p><span style=\"font-weight: 400\">G\u00e9n\u00e9rer de vastes quantit\u00e9s de donn\u00e9es pour des IA affam\u00e9es tout en g\u00e9rant les risques est un travail en cours.\u00a0<\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Les donn\u00e9es sont l'\u00e9l\u00e9ment vital de l'IA, mais elles ne constituent pas une ressource infinie. L'humanit\u00e9 peut-elle manquer de donn\u00e9es ? Que se passera-t-il si c'est le cas ? Les mod\u00e8les d'IA complexes n\u00e9cessitent de grandes quantit\u00e9s de donn\u00e9es d'entra\u00eenement. Par exemple, l'entra\u00eenement d'un grand mod\u00e8le linguistique (LLM) comme ChatGPT n\u00e9cessite environ 10 000 milliards de mots.  Certains experts estiment que les r\u00e9serves de donn\u00e9es de haute qualit\u00e9 s'amenuisent. Par exemple, une \u00e9tude r\u00e9alis\u00e9e en 2022 par des chercheurs de plusieurs universit\u00e9s indique que \"notre analyse indique que le stock de donn\u00e9es linguistiques de haute qualit\u00e9 sera bient\u00f4t \u00e9puis\u00e9, probablement avant 2026... Notre travail sugg\u00e8re que la tendance actuelle des mod\u00e8les de ML en croissance constante qui s'appuient sur d'\u00e9normes<\/p>","protected":false},"author":2,"featured_media":1874,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[87],"tags":[150,145,160,105],"class_list":["post-1871","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-opinions","tag-ai-benefits","tag-ai-risk","tag-data-science","tag-machine-learning"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>What happens when AI starts consuming its own output? | DailyAI<\/title>\n<meta name=\"description\" content=\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/fr\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"What happens when AI starts consuming its own output? | DailyAI\" \/>\n<meta property=\"og:description\" content=\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/fr\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2023-06-18T22:43:50+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-03-28T00:48:00+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1000\" \/>\n\t<meta property=\"og:image:height\" content=\"667\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"What happens when AI starts consuming its own output?\",\"datePublished\":\"2023-06-18T22:43:50+00:00\",\"dateModified\":\"2024-03-28T00:48:00+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"},\"wordCount\":1487,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"keywords\":[\"AI benefits\",\"AI risk\",\"Data science\",\"machine learning\"],\"articleSection\":{\"1\":\"Opinions &amp; Analysis\"},\"inLanguage\":\"fr-FR\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\",\"name\":\"What happens when AI starts consuming its own output? | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"datePublished\":\"2023-06-18T22:43:50+00:00\",\"dateModified\":\"2024-03-28T00:48:00+00:00\",\"description\":\"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/shutterstock_2256543489.jpg\",\"width\":1000,\"height\":667,\"caption\":\"AI generated data\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/06\\\/what-happens-when-ai-starts-consuming-its-own-output\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"What happens when AI starts consuming its own output?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/fr\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Que se passe-t-il lorsque l'IA commence \u00e0 consommer sa propre production ? | DailyAI","description":"Les donn\u00e9es sont l'\u00e9l\u00e9ment vital de l'IA, mais elles ne constituent pas une ressource infinie. L'humanit\u00e9 peut-elle manquer de donn\u00e9es ? Que se passera-t-il si c'est le cas ?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/fr\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","og_locale":"fr_FR","og_type":"article","og_title":"What happens when AI starts consuming its own output? | DailyAI","og_description":"Data is the lifeblood of AI, but it\u2019s not an infinite resource. Can humanity run out of data? What happens if we do?","og_url":"https:\/\/dailyai.com\/fr\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","og_site_name":"DailyAI","article_published_time":"2023-06-18T22:43:50+00:00","article_modified_time":"2024-03-28T00:48:00+00:00","og_image":[{"width":1000,"height":667,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","type":"image\/jpeg"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"\u00c9crit par":"Sam Jeans","Dur\u00e9e de lecture estim\u00e9e":"7 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"What happens when AI starts consuming its own output?","datePublished":"2023-06-18T22:43:50+00:00","dateModified":"2024-03-28T00:48:00+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"},"wordCount":1487,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","keywords":["AI benefits","AI risk","Data science","machine learning"],"articleSection":{"1":"Opinions &amp; Analysis"},"inLanguage":"fr-FR"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","url":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/","name":"Que se passe-t-il lorsque l'IA commence \u00e0 consommer sa propre production ? | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","datePublished":"2023-06-18T22:43:50+00:00","dateModified":"2024-03-28T00:48:00+00:00","description":"Les donn\u00e9es sont l'\u00e9l\u00e9ment vital de l'IA, mais elles ne constituent pas une ressource infinie. L'humanit\u00e9 peut-elle manquer de donn\u00e9es ? Que se passera-t-il si c'est le cas ?","breadcrumb":{"@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/shutterstock_2256543489.jpg","width":1000,"height":667,"caption":"AI generated data"},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"What happens when AI starts consuming its own output?"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Votre dose quotidienne de nouvelles sur l'IA","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam est un r\u00e9dacteur scientifique et technologique qui a travaill\u00e9 dans diverses start-ups sp\u00e9cialis\u00e9es dans l'IA. Lorsqu'il n'\u00e9crit pas, on peut le trouver en train de lire des revues m\u00e9dicales ou de fouiller dans des bo\u00eetes de disques vinyles.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/fr\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/posts\/1871","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/comments?post=1871"}],"version-history":[{"count":38,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/posts\/1871\/revisions"}],"predecessor-version":[{"id":2136,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/posts\/1871\/revisions\/2136"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/media\/1874"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/media?parent=1871"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/categories?post=1871"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/fr\/wp-json\/wp\/v2\/tags?post=1871"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}