{"id":11426,"date":"2024-04-08T17:45:24","date_gmt":"2024-04-08T17:45:24","guid":{"rendered":"https:\/\/dailyai.com\/?p=11426"},"modified":"2024-04-09T08:28:17","modified_gmt":"2024-04-09T08:28:17","slug":"inside-big-techs-tussle-over-ai-training-data","status":"publish","type":"post","link":"https:\/\/dailyai.com\/de\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/","title":{"rendered":"Einblicke in das Gerangel um KI-Trainingsdaten bei Big Tech"},"content":{"rendered":"<p><b>Auf der Jagd nach KI-Trainingsdaten haben die Tech-Giganten OpenAI, Google und Meta Berichten zufolge Unternehmensrichtlinien umgangen, ihre Regeln ge\u00e4ndert und die Umgehung von Urheberrechtsgesetzen diskutiert.\u00a0<\/b><\/p>\n<p><span style=\"font-weight: 400;\">A <\/span><a href=\"https:\/\/www.nytimes.com\/2024\/04\/06\/technology\/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore-ios-share&amp;sgrp=c-cb\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Untersuchung der New York Times<\/span><\/a><span style=\"font-weight: 400;\"> zeigt, wie weit diese Unternehmen gehen, um Online-Informationen f\u00fcr ihre datenhungrigen KI-Systeme zu sammeln.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Ende 2021 entwickelten OpenAI-Forscher ein Spracherkennungstool namens Whisper, um YouTube-Videos zu transkribieren, wenn es an seri\u00f6sen englischsprachigen Textdaten mangelt.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Trotz interner Diskussionen \u00fcber einen m\u00f6glichen Versto\u00df gegen die YouTube-Regeln, die die Nutzung der Videos f\u00fcr \"unabh\u00e4ngige\" Anwendungen untersagen,\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die NYT fand heraus, dass OpenAI letztendlich \u00fcber eine Million Stunden an YouTube-Inhalten transkribiert hat. Greg Brockman, der Pr\u00e4sident von OpenAI, hat pers\u00f6nlich beim Sammeln der Videos geholfen. Der transkribierte Text wurde dann in GPT-4 eingespeist.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Google soll auch YouTube-Videos transkribiert haben, um Text f\u00fcr seine KI-Modelle zu sammeln, was m\u00f6glicherweise gegen die Urheberrechte der Videoautoren verst\u00f6\u00dft. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Dies geschieht wenige Tage nachdem der CEO von YouTube erkl\u00e4rt hat, dass solche Aktivit\u00e4ten gegen die <\/span><a href=\"https:\/\/dailyai.com\/de\/2024\/04\/youtube-ceo-warns-openai-about-potential-terms-of-service-violation\/\"><span style=\"font-weight: 400;\">Gesch\u00e4ftsbedingungen des Unternehmens<\/span><\/a><span style=\"font-weight: 400;\"> und untergraben die Sch\u00f6pfer.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Im Juni 2023 beantragte die Rechtsabteilung von Google \u00c4nderungen an den Datenschutzrichtlinien des Unternehmens, um \u00f6ffentlich zug\u00e4ngliche Inhalte aus Google Text &amp; Tabellen und anderen Google-Anwendungen f\u00fcr eine breitere Palette von KI-Produkten zu erm\u00f6glichen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Meta hat angesichts seiner eigenen Datenknappheit verschiedene M\u00f6glichkeiten in Betracht gezogen, um mehr Trainingsdaten zu erhalten.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die F\u00fchrungskr\u00e4fte diskutierten dar\u00fcber, f\u00fcr Buchlizenzen zu zahlen, den Verlag Simon &amp; Schuster zu kaufen und sogar urheberrechtlich gesch\u00fctztes Material ohne Erlaubnis aus dem Internet zu holen und damit m\u00f6gliche Klagen zu riskieren.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die Anw\u00e4lte von Meta argumentierten, dass die Verwendung von Daten zum Trainieren von KI-Systemen unter die \"faire Nutzung\" fallen sollte und beriefen sich dabei auf ein Gerichtsurteil aus dem Jahr 2015, in dem es um Googles Buchscan-Projekt ging.<\/span><\/p>\n<h2>Ethische Bedenken und die Zukunft der KI-Trainingsdaten<\/h2>\n<p><span style=\"font-weight: 400;\">Die kollektiven Ma\u00dfnahmen dieser Technologieunternehmen unterstreichen die entscheidende Bedeutung von Online-Daten f\u00fcr die boomende KI-Branche.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Diese Praktiken haben Bedenken hinsichtlich der Verletzung von Urheberrechten und der gerechten Entsch\u00e4digung von Urhebern aufgeworfen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die Filmemacherin und Autorin Justine Bateman hat dem Copyright Office mitgeteilt, dass KI-Modelle Inhalte - einschlie\u00dflich ihrer Texte und Filme - ohne Erlaubnis oder Bezahlung \u00fcbernehmen. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">\"Dies ist der gr\u00f6\u00dfte Diebstahl in den Vereinigten Staaten, Punkt\", sagte sie in einem Interview.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">In der bildenden Kunst wurden MidJourney und andere Bildmodelle <\/span><a href=\"https:\/\/dailyai.com\/de\/2024\/01\/16000-artist-names-leaked-as-midjourney-styles\/\"><span style=\"font-weight: 400;\">nachweislich Urheberrechte erzeugen<\/span><\/a><span style=\"font-weight: 400;\"> Inhalte, wie Szenen aus Marvel-Filmen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Da einige Experten vorhersagen, dass hochwertige Online-Daten bis 2026 ersch\u00f6pft sein k\u00f6nnten, erforschen Unternehmen alternative Methoden, wie z. B. die Generierung synthetischer Daten mithilfe von KI-Modellen selbst.\u00a0<\/span><span style=\"font-weight: 400;\">Synthetische Trainingsdaten sind jedoch mit eigenen Risiken und Herausforderungen verbunden und k\u00f6nnten sich nachteilig auswirken <\/span><a href=\"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\"><span style=\"font-weight: 400;\">Auswirkungen auf die Qualit\u00e4t der Modelle<\/span><\/a><span style=\"font-weight: 400;\">.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Der CEO von OpenAI, Sam Altman, r\u00e4umte in einer Rede auf einer Technologiekonferenz im Mai 2023 selbst ein, dass die Online-Daten endlich sind: \"Das wird ausgehen\", sagte er.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Sy Damle, ein Anwalt, der Andreessen Horowitz, ein Risikokapitalunternehmen aus dem Silicon Valley, vertritt, er\u00f6rterte ebenfalls die Herausforderung: \"Die einzige praktische M\u00f6glichkeit f\u00fcr diese Tools besteht darin, dass sie auf riesigen Datenmengen trainiert werden k\u00f6nnen, ohne diese Daten lizenzieren zu m\u00fcssen. Die ben\u00f6tigten Daten sind so umfangreich, dass selbst eine kollektive Lizenzierung nicht wirklich funktionieren kann\".<\/span><\/p>\n<p>Die NYT und OpenAI sind in einen Streit verwickelt <a href=\"https:\/\/dailyai.com\/de\/2023\/08\/the-new-york-times-may-sue-openai-over-copyright-claims\/\">Bittere Urheberrechtsklage<\/a>Die Times fordert Schadenersatz in Millionenh\u00f6he.<\/p>\n<p>OpenAI schlug zur\u00fcck und beschuldigte die Times <a href=\"https:\/\/dailyai.com\/de\/2024\/02\/openai-blasts-the-new-york-times-claiming-they-hacked-their-evidence\/\">ihre Modelle 'hacken'<\/a> um Beispiele f\u00fcr Urheberrechtsverletzungen zu finden.<\/p>\n<p>Mit \"hacken\" meinen sie \"jailbreaking\" oder \"red-teaming\", bei dem das Modell mit speziell formulierten Aufforderungen angegriffen wird, um die Ergebnisse zu manipulieren.<\/p>\n<p>Die NYT sagte, dass sie nicht auf Jailbreaking-Modelle zur\u00fcckgreifen m\u00fcssten, wenn KI-Unternehmen transparent \u00fcber die von ihnen verwendeten Daten w\u00e4ren.<\/p>\n<p>Zweifelsohne stellt diese interne Untersuchung den Datenraub von Big Tech als ethisch und rechtlich inakzeptabel dar.<\/p>\n<p><span style=\"font-weight: 400;\">Die Rechtsstreitigkeiten h\u00e4ufen sich,<\/span><span style=\"font-weight: 400;\">\u00a0Die rechtliche Situation im Zusammenhang mit der Nutzung von Online-Daten f\u00fcr das KI-Training ist \u00e4u\u00dferst prek\u00e4r.\u00a0<\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Auf der rasanten Jagd nach KI-Trainingsdaten haben die Tech-Giganten OpenAI, Google und Meta Berichten zufolge Unternehmensrichtlinien umgangen, ihre Regeln ge\u00e4ndert und die Umgehung von Urheberrechtsgesetzen diskutiert.  Eine Untersuchung der New York Times zeigt, wie weit diese Unternehmen gehen, um Online-Informationen f\u00fcr ihre datenhungrigen KI-Systeme zu sammeln. Ende 2021 entwickelten OpenAI-Forscher ein Spracherkennungs-Tool namens Whisper, um YouTube-Videos zu transkribieren, wenn ein Mangel an seri\u00f6sen englischsprachigen Textdaten bestand.  Trotz interner Diskussionen \u00fcber einen m\u00f6glichen Versto\u00df gegen die YouTube-Regeln, die die Verwendung von YouTube-Videos f\u00fcr \"unabh\u00e4ngige\" Anwendungen verbieten, fand die NYT heraus, dass OpenAI letztendlich \u00fcber eine Million Stunden transkribierte<\/p>","protected":false},"author":2,"featured_media":11427,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[88],"tags":[197],"class_list":["post-11426","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ethics","tag-copyright"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.1 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Inside Big Tech\u2019s tussle over AI training data | DailyAI<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/de\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Inside Big Tech\u2019s tussle over AI training data | DailyAI\" \/>\n<meta property=\"og:description\" content=\"In the frantic pursuit of AI training data, tech giants OpenAI, Google, and Meta have reportedly bypassed corporate policies, altered their rules, and discussed circumventing copyright law.\u00a0 A New York Times investigation reveals the lengths these companies have gone to harvest online information to feed their data-hungry AI systems. In late 2021, OpenAI researchers developed a speech recognition tool called Whisper to transcribe YouTube videos when facing a shortage of reputable English-language text data.\u00a0 Despite internal discussions about potentially violating YouTube&#8217;s rules, which prohibit using its videos for &#8220;independent&#8221; applications,\u00a0 NYT found that OpenAI ultimately transcribed over one million hours\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/de\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2024-04-08T17:45:24+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-04-09T08:28:17+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/04\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp\" \/>\n\t<meta property=\"og:image:width\" content=\"1792\" \/>\n\t<meta property=\"og:image:height\" content=\"1024\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/webp\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"Inside Big Tech\u2019s tussle over AI training data\",\"datePublished\":\"2024-04-08T17:45:24+00:00\",\"dateModified\":\"2024-04-09T08:28:17+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/\"},\"wordCount\":621,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp\",\"keywords\":[\"Copyright\"],\"articleSection\":[\"Ethics &amp; Society\"],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/\",\"name\":\"Inside Big Tech\u2019s tussle over AI training data | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp\",\"datePublished\":\"2024-04-08T17:45:24+00:00\",\"dateModified\":\"2024-04-09T08:28:17+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2024\\\/04\\\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp\",\"width\":1792,\"height\":1024,\"caption\":\"Data\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2024\\\/04\\\/inside-big-techs-tussle-over-ai-training-data\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Inside Big Tech\u2019s tussle over AI training data\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/de\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Einblicke in das Gerangel um KI-Trainingsdaten bei Big Tech | DailyAI","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/de\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/","og_locale":"de_DE","og_type":"article","og_title":"Inside Big Tech\u2019s tussle over AI training data | DailyAI","og_description":"In the frantic pursuit of AI training data, tech giants OpenAI, Google, and Meta have reportedly bypassed corporate policies, altered their rules, and discussed circumventing copyright law.\u00a0 A New York Times investigation reveals the lengths these companies have gone to harvest online information to feed their data-hungry AI systems. In late 2021, OpenAI researchers developed a speech recognition tool called Whisper to transcribe YouTube videos when facing a shortage of reputable English-language text data.\u00a0 Despite internal discussions about potentially violating YouTube&#8217;s rules, which prohibit using its videos for &#8220;independent&#8221; applications,\u00a0 NYT found that OpenAI ultimately transcribed over one million hours","og_url":"https:\/\/dailyai.com\/de\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/","og_site_name":"DailyAI","article_published_time":"2024-04-08T17:45:24+00:00","article_modified_time":"2024-04-09T08:28:17+00:00","og_image":[{"width":1792,"height":1024,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/04\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp","type":"image\/webp"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Verfasst von":"Sam Jeans","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"Inside Big Tech\u2019s tussle over AI training data","datePublished":"2024-04-08T17:45:24+00:00","dateModified":"2024-04-09T08:28:17+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/"},"wordCount":621,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/04\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp","keywords":["Copyright"],"articleSection":["Ethics &amp; Society"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/","url":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/","name":"Einblicke in das Gerangel um KI-Trainingsdaten bei Big Tech | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/04\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp","datePublished":"2024-04-08T17:45:24+00:00","dateModified":"2024-04-09T08:28:17+00:00","breadcrumb":{"@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/04\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2024\/04\/DALL\u00b7E-2024-04-08-18.42.46-Visualize-a-dramatic-and-futuristic-scene-inside-a-vast-data-center-filled-with-towering-server-racks-emitting-blue-and-red-lights-casting-a-vibrant.webp","width":1792,"height":1024,"caption":"Data"},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2024\/04\/inside-big-techs-tussle-over-ai-training-data\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"Inside Big Tech\u2019s tussle over AI training data"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Ihre t\u00e4gliche Dosis an AI-Nachrichten","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/de\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/11426","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/comments?post=11426"}],"version-history":[{"count":7,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/11426\/revisions"}],"predecessor-version":[{"id":11434,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/11426\/revisions\/11434"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media\/11427"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media?parent=11426"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/categories?post=11426"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/tags?post=11426"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}