{"id":6804,"date":"2023-10-26T19:21:21","date_gmt":"2023-10-26T19:21:21","guid":{"rendered":"https:\/\/dailyai.com\/?p=6804"},"modified":"2023-10-26T21:16:11","modified_gmt":"2023-10-26T21:16:11","slug":"new-research-into-datasets-reveals-systemic-ethical-and-legal-issues","status":"publish","type":"post","link":"https:\/\/dailyai.com\/de\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/","title":{"rendered":"Neue Untersuchung von Datens\u00e4tzen offenbart systemische ethische und rechtliche Probleme"},"content":{"rendered":"<p><b>Bei der KI geht es um Daten, aber woher kommen sie? Sind Datens\u00e4tze legal und ethisch vertretbar? Wie k\u00f6nnen Entwickler das mit Sicherheit feststellen?\u00a0<\/b><\/p>\n<p><span style=\"font-weight: 400;\">F\u00fcr das Training von Modellen des maschinellen Lernens, wie z. B. Large Language Models (LLM), werden gro\u00dfe Mengen an Textdaten ben\u00f6tigt.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Auf Plattformen wie Kaggle, GitHub und Hugging Face sind stapelweise Datens\u00e4tze verf\u00fcgbar, aber sie bewegen sich in einer rechtlichen und ethischen Grauzone, vor allem aufgrund von Lizenzierungs- und Fair-Use-Problemen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die <a href=\"https:\/\/www.dataprovenance.org\/\">Initiative zur Datenprovenienz<\/a>, eine Zusammenarbeit zwischen KI-Forschern und Juristen, hat Tausende von Datens\u00e4tzen untersucht, um ihren wahren Ursprung zu ergr\u00fcnden. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Es <\/span><span style=\"font-weight: 400;\">konzentrierte sich auf \u00fcber 1.800 Datens\u00e4tze, die auf Plattformen wie Hugging Face, GitHub und Papers With Code verf\u00fcgbar sind. <\/span><span style=\"font-weight: 400;\">Die Datens\u00e4tze sind in erster Linie f\u00fcr die Feinabstimmung von Open-Source-Modellen wie Llama-2 gedacht.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die Studie ergab, dass etwa 70% dieser Datens\u00e4tze entweder keine klaren Lizenzinformationen enthielten oder mit zu freiz\u00fcgigen Lizenzen versehen waren.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Aufgrund des eklatanten Mangels an Klarheit \u00fcber Urheberrechte und kommerzielle Nutzungsbeschr\u00e4nkungen besteht f\u00fcr KI-Entwickler die Gefahr, versehentlich gegen das Gesetz zu versto\u00dfen oder Urheberrechte zu verletzen.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Shayne Longpre, ein Doktorand am MIT Media Lab, der die Pr\u00fcfung leitete, betonte, dass das Problem nicht die Schuld der Hosting-Plattformen sei, sondern eher ein systemisches Problem innerhalb der Gemeinschaft des maschinellen Lernens.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">2023 hat sich eine <a href=\"https:\/\/dailyai.com\/de\/2023\/09\/george-r-r-martin-and-17-other-writers-file-lawsuit-against-openai\/\">Flut von Prozessen<\/a> die auf gro\u00dfe KI-Entwickler wie Meta, Anthropic und OpenAI abzielen, die unter extremem Druck stehen, transparentere Datenerhebungspraktiken anzuwenden. Verordnungen, wie zum Beispiel die <a href=\"https:\/\/dailyai.com\/de\/2023\/06\/eu-ai-act-passes-crucial-vote-and-enters-its-final-stages\/\">Das KI-Gesetz der EU<\/a>sind darauf ausgerichtet, genau das durchzusetzen.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die Data Provenance Initiative erm\u00f6glicht es Entwicklern von maschinellem Lernen <\/span><a href=\"https:\/\/www.dataprovenance.org\/\"><span style=\"font-weight: 400;\">Erkunden Sie die gepr\u00fcften Datens\u00e4tze hier<\/span><\/a><span style=\"font-weight: 400;\">. Im Rahmen der Initiative werden auch Muster innerhalb von Datens\u00e4tzen analysiert, die Aufschluss \u00fcber deren geografische und institutionelle Herkunft geben.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Die meisten Datens\u00e4tze wurden im englischsprachigen globalen Norden erstellt, was die soziokulturellen Ungleichgewichte verdeutlicht.\u00a0<\/span><\/p>\n<figure id=\"attachment_6805\" aria-describedby=\"caption-attachment-6805\" style=\"width: 973px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-6805 size-full\" src=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution.png\" alt=\"Datenherkunft AI\" width=\"973\" height=\"529\" srcset=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution.png 973w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-300x163.png 300w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-768x418.png 768w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-370x201.png 370w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-800x435.png 800w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-20x11.png 20w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-740x402.png 740w, https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/datadistribution-88x48.png 88w\" sizes=\"auto, (max-width: 973px) 100vw, 973px\" \/><figcaption id=\"caption-attachment-6805\" class=\"wp-caption-text\">Die Data Provenance Initiative hat festgestellt, dass die Datens\u00e4tze \u00fcberwiegend englischsprachige L\u00e4nder und den globalen Norden repr\u00e4sentieren. Quelle: <a href=\"https:\/\/www.dataprovenance.org\/paper.pdf\">Daten Provenance.org<\/a>.<\/figcaption><\/figure>\n<h2><span style=\"font-weight: 400;\">Mehr \u00fcber die Studie<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Diese gro\u00df angelegte Analyse von Datens\u00e4tzen deckte systematische Probleme mit der Art und Weise der Datenerhebung und -verteilung auf. Die Initiative hat auch ein Papier erstellt, um ihre Ergebnisse zu erl\u00e4utern, <\/span><a href=\"https:\/\/www.dataprovenance.org\/paper.pdf\"><span style=\"font-weight: 400;\">hier ver\u00f6ffentlicht<\/span><\/a><span style=\"font-weight: 400;\">.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Hier finden Sie weitere Informationen \u00fcber die Methoden und Ergebnisse der Studie:<\/span><\/p>\n<ol>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><b>Analyse von Datens\u00e4tzen auf Herkunft und Kennzeichnung<\/b><span style=\"font-weight: 400;\">: In dieser Studie wurden \u00fcber 1800 Feinabstimmungsdatens\u00e4tze systematisch gepr\u00fcft, um ihre Datenherkunft, Lizenzierung und Dokumentation zu untersuchen.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><b>Beweise f\u00fcr eine falsche Etikettierung<\/b><span style=\"font-weight: 400;\">: Die Ergebnisse verdeutlichen die Kluft zwischen den unter verschiedenen Lizenzen verf\u00fcgbaren Datentypen und die Auswirkungen auf die rechtliche Auslegung des Urheberrechts und die faire Nutzung. Die Studie f\u00f6rderte eine hohe Rate an Fehlkategorisierungen von Lizenzen zutage, wobei mehr als 72% der Datens\u00e4tze keine Lizenz spezifizierten und eine Fehlerquote von 50% bei denjenigen, die dies taten.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><b>Unzuverl\u00e4ssige Datenherkunft<\/b><span style=\"font-weight: 400;\">: Die Forschung lenkt die Aufmerksamkeit auf das Problem der unzuverl\u00e4ssigen Datenherkunft und unterstreicht die Notwendigkeit von Standards zur R\u00fcckverfolgung der Datenherkunft, zur Gew\u00e4hrleistung einer korrekten Zuordnung und zur F\u00f6rderung einer verantwortungsvollen Datennutzung.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><b>Geografische Verbreitung: <\/b><span style=\"font-weight: 400;\">Die Studie zeigt einen gravierenden Mangel an Darstellung und Zuordnung von Datens\u00e4tzen aus dem globalen S\u00fcden auf. Die meisten Datens\u00e4tze drehen sich um die englische Sprache und sind kulturell an Europa, Nordamerika und den englischsprachigen Teil Ozeaniens gebunden.\u00a0<\/span><\/li>\n<\/ol>\n<p><span style=\"font-weight: 400;\">Diese Studie zeigt systemische und strukturelle Probleme bei der Erstellung, Verteilung und Nutzung von Daten auf. Daten sind eine wichtige Ressource f\u00fcr KI, und \u00e4hnlich wie nat\u00fcrliche Ressourcen sind sie endlich.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Es besteht die Bef\u00fcrchtung, dass die KI-Technologie \u00fcber kurz oder lang die aktuellen Datens\u00e4tze \u00fcbersteigen wird und m\u00f6glicherweise sogar <\/span><a href=\"https:\/\/dailyai.com\/de\/2023\/06\/what-happens-when-ai-starts-consuming-its-own-output\/\"><span style=\"font-weight: 400;\">beginnen, ihre eigene Ausgabe zu verbrauchen<\/span><\/a><span style=\"font-weight: 400;\">Das bedeutet, dass die KI-Modelle aus dem von der KI generierten Text lernen werden.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Dies k\u00f6nnte die Qualit\u00e4t der Modelle untergraben, was bedeutet, dass qualitativ hochwertige, ethische und legale Daten sehr wertvoll werden k\u00f6nnten. <\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Bei der KI geht es um Daten, aber woher kommen sie? Sind Datens\u00e4tze legal und ethisch vertretbar? Wie k\u00f6nnen die Entwickler das mit Sicherheit feststellen?  F\u00fcr das Training von Modellen des maschinellen Lernens, wie z. B. Large Language Models (LLM), werden gro\u00dfe Mengen an Textdaten ben\u00f6tigt.  Auf Plattformen wie Kaggle, GitHub und Hugging Face sind stapelweise Datens\u00e4tze verf\u00fcgbar, die sich jedoch in einer rechtlichen und ethischen Grauzone bewegen, vor allem aufgrund von Lizenzierungs- und Fair-Use-Fragen.  Die Data Provenance Initiative, ein Gemeinschaftsprojekt von KI-Forschern und Juristen, hat Tausende von Datens\u00e4tzen untersucht, um ihre wahre Herkunft zu kl\u00e4ren. Sie konzentrierte sich auf \u00fcber 1.800<\/p>","protected":false},"author":2,"featured_media":6806,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[84],"tags":[454,453,105],"class_list":["post-6804","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry","tag-data","tag-datasets","tag-machine-learning"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>New research into datasets reveals systemic ethical and legal issues | DailyAI<\/title>\n<meta name=\"description\" content=\"AI revolves around data, but where does it come from? Is it legal to use? It might be labeled as such, but is it really?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/dailyai.com\/de\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"New research into datasets reveals systemic ethical and legal issues | DailyAI\" \/>\n<meta property=\"og:description\" content=\"AI revolves around data, but where does it come from? Is it legal to use? It might be labeled as such, but is it really?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/dailyai.com\/de\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/\" \/>\n<meta property=\"og:site_name\" content=\"DailyAI\" \/>\n<meta property=\"article:published_time\" content=\"2023-10-26T19:21:21+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-10-26T21:16:11+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_1166248483.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1000\" \/>\n\t<meta property=\"og:image:height\" content=\"583\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Sam Jeans\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:site\" content=\"@DailyAIOfficial\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sam Jeans\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"3\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"NewsArticle\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/\"},\"author\":{\"name\":\"Sam Jeans\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\"},\"headline\":\"New research into datasets reveals systemic ethical and legal issues\",\"datePublished\":\"2023-10-26T19:21:21+00:00\",\"dateModified\":\"2023-10-26T21:16:11+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/\"},\"wordCount\":576,\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_1166248483.jpg\",\"keywords\":[\"Data\",\"Datasets\",\"machine learning\"],\"articleSection\":[\"Industry\"],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/\",\"name\":\"New research into datasets reveals systemic ethical and legal issues | DailyAI\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_1166248483.jpg\",\"datePublished\":\"2023-10-26T19:21:21+00:00\",\"dateModified\":\"2023-10-26T21:16:11+00:00\",\"description\":\"AI revolves around data, but where does it come from? Is it legal to use? It might be labeled as such, but is it really?\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#primaryimage\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_1166248483.jpg\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/10\\\/shutterstock_1166248483.jpg\",\"width\":1000,\"height\":583},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/2023\\\/10\\\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/dailyai.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"New research into datasets reveals systemic ethical and legal issues\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#website\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"name\":\"DailyAI\",\"description\":\"Your Daily Dose of AI News\",\"publisher\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/dailyai.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#organization\",\"name\":\"DailyAI\",\"url\":\"https:\\\/\\\/dailyai.com\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"contentUrl\":\"https:\\\/\\\/dailyai.com\\\/wp-content\\\/uploads\\\/2023\\\/06\\\/Daily-Ai_TL_colour.png\",\"width\":4501,\"height\":934,\"caption\":\"DailyAI\"},\"image\":{\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/x.com\\\/DailyAIOfficial\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/dailyaiofficial\\\/\",\"https:\\\/\\\/www.youtube.com\\\/@DailyAIOfficial\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/dailyai.com\\\/#\\\/schema\\\/person\\\/711e81f945549438e8bbc579efdeb3c9\",\"name\":\"Sam Jeans\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g\",\"caption\":\"Sam Jeans\"},\"description\":\"Sam is a science and technology writer who has worked in various AI startups. When he\u2019s not writing, he can be found reading medical journals or digging through boxes of vinyl records.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/sam-jeans-6746b9142\\\/\"],\"url\":\"https:\\\/\\\/dailyai.com\\\/de\\\/author\\\/samjeans\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Neue Forschung zu Datens\u00e4tzen offenbart systemische ethische und rechtliche Probleme | DailyAI","description":"Bei der KI geht es um Daten, aber woher kommen sie? Ist ihre Nutzung legal? Sie m\u00f6gen als solche gekennzeichnet sein, aber sind sie es wirklich?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/dailyai.com\/de\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/","og_locale":"de_DE","og_type":"article","og_title":"New research into datasets reveals systemic ethical and legal issues | DailyAI","og_description":"AI revolves around data, but where does it come from? Is it legal to use? It might be labeled as such, but is it really?","og_url":"https:\/\/dailyai.com\/de\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/","og_site_name":"DailyAI","article_published_time":"2023-10-26T19:21:21+00:00","article_modified_time":"2023-10-26T21:16:11+00:00","og_image":[{"width":1000,"height":583,"url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_1166248483.jpg","type":"image\/jpeg"}],"author":"Sam Jeans","twitter_card":"summary_large_image","twitter_creator":"@DailyAIOfficial","twitter_site":"@DailyAIOfficial","twitter_misc":{"Verfasst von":"Sam Jeans","Gesch\u00e4tzte Lesezeit":"3\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"NewsArticle","@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#article","isPartOf":{"@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/"},"author":{"name":"Sam Jeans","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9"},"headline":"New research into datasets reveals systemic ethical and legal issues","datePublished":"2023-10-26T19:21:21+00:00","dateModified":"2023-10-26T21:16:11+00:00","mainEntityOfPage":{"@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/"},"wordCount":576,"publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"image":{"@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_1166248483.jpg","keywords":["Data","Datasets","machine learning"],"articleSection":["Industry"],"inLanguage":"de"},{"@type":"WebPage","@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/","url":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/","name":"Neue Forschung zu Datens\u00e4tzen offenbart systemische ethische und rechtliche Probleme | DailyAI","isPartOf":{"@id":"https:\/\/dailyai.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#primaryimage"},"image":{"@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#primaryimage"},"thumbnailUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_1166248483.jpg","datePublished":"2023-10-26T19:21:21+00:00","dateModified":"2023-10-26T21:16:11+00:00","description":"Bei der KI geht es um Daten, aber woher kommen sie? Ist ihre Nutzung legal? Sie m\u00f6gen als solche gekennzeichnet sein, aber sind sie es wirklich?","breadcrumb":{"@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#primaryimage","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_1166248483.jpg","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/10\/shutterstock_1166248483.jpg","width":1000,"height":583},{"@type":"BreadcrumbList","@id":"https:\/\/dailyai.com\/2023\/10\/new-research-into-datasets-reveals-systemic-ethical-and-legal-issues\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/dailyai.com\/"},{"@type":"ListItem","position":2,"name":"New research into datasets reveals systemic ethical and legal issues"}]},{"@type":"WebSite","@id":"https:\/\/dailyai.com\/#website","url":"https:\/\/dailyai.com\/","name":"DailyAI","description":"Ihre t\u00e4gliche Dosis an AI-Nachrichten","publisher":{"@id":"https:\/\/dailyai.com\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/dailyai.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/dailyai.com\/#organization","name":"DailyAI","url":"https:\/\/dailyai.com\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/","url":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","contentUrl":"https:\/\/dailyai.com\/wp-content\/uploads\/2023\/06\/Daily-Ai_TL_colour.png","width":4501,"height":934,"caption":"DailyAI"},"image":{"@id":"https:\/\/dailyai.com\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/DailyAIOfficial","https:\/\/www.linkedin.com\/company\/dailyaiofficial\/","https:\/\/www.youtube.com\/@DailyAIOfficial"]},{"@type":"Person","@id":"https:\/\/dailyai.com\/#\/schema\/person\/711e81f945549438e8bbc579efdeb3c9","name":"Sam Jeans","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a24a4a8f8e2a1a275b7491dc9c9f032c401eabf23c3206da4628dc84b6dac5c8?s=96&d=robohash&r=g","caption":"Sam Jeans"},"description":"Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.","sameAs":["https:\/\/www.linkedin.com\/in\/sam-jeans-6746b9142\/"],"url":"https:\/\/dailyai.com\/de\/author\/samjeans\/"}]}},"_links":{"self":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/6804","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/comments?post=6804"}],"version-history":[{"count":11,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/6804\/revisions"}],"predecessor-version":[{"id":6837,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/posts\/6804\/revisions\/6837"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media\/6806"}],"wp:attachment":[{"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/media?parent=6804"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/categories?post=6804"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dailyai.com\/de\/wp-json\/wp\/v2\/tags?post=6804"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}