I sin iver etter å dominere AI-industrien tøyer teknologigigantene de etiske grensene og tester grensene for offentlig tillit.
En rekke avsløringer den siste tiden får alarmklokkene til å ringe når det gjelder personvern, rettferdig konkurranse og konsentrasjon av makt og talent.
For det første, en undersøkelse av Proof News og WIRED avdekket at Apple, NVIDIA, Anthropic og Salesforce har brukt et datasett som inneholder undertekster fra over 170 000 YouTube-videoer for å trene opp AI-modellene sine.
Dette datasettet, kjent som "YouTube Subtitles", ble samlet inn uten samtykke fra innholdsskaperne, noe som potensielt bryter med YouTubes tjenestevilkår.
Omfanget av denne datautvinningsoperasjonen er svimlende. Den omfatter innhold fra utdanningsinstitusjoner som Harvard, populære YouTubere som MrBeast og PewDiePie, og til og med store nyhetsbyråer som The Wall Street Journal og BBC.
Undersøkelsen viser at et datasett som brukes til gen AI-trening av Apple & andre inneholder opphavsrettslig beskyttede YouTube-utskrifter som er hentet uten tillatelse. Mer informasjon:
- Pile-datasettet inneholder transkripsjoner av 170 000 YouTube-videoer
- Brukes av Apple, Anthropic, Nvidia, Salesforce og mer... pic.twitter.com/RE0UjhumA3- Ed Newton-Rex (@ednewtonrex) 16. juli 2024
YouTube har ennå ikke reagert, men allerede i april sa administrerende direktør Neal Mohan at OpenAIs potensielle bruk av videoer for å trene tekst-til-video-modellen Sora ville være i strid med tjenestevilkåreneSora sa til Bloomberg: "Hvis Sora brukte innhold fra YouTube, ville det være et "klart brudd" på tjenestevilkårene."
OpenAI er ikke blant de anklagede denne gangen, og vi vet ikke om YouTube vil forsøke å ta affære dersom de nye anklagene viser seg å være sanne.
Dette er langt fra første gang teknologiselskaper har havnet i søkelyset på grunn av sin databrukspraksis.
I 2018 ble Facebook gjenstand for intens granskning på grunn av Cambridge Analytica-skandalen, der data fra millioner av brukere ble innhentet uten samtykke for politisk reklame.
I 2023 ble det oppdaget at en datasett kalt Books3som inneholdt over 180 000 opphavsrettsbeskyttede bøker, hadde blitt brukt til å trene AI-modeller uten forfatternes tillatelse. Dette førte til en bølge av søksmål mot AI-selskaper, der forfatterne hevdet brudd på opphavsretten.
Det er bare ett eksempel fra en stadig voksende bunke søksmål som kommer fra alle hjørner av den kreative industrien. Universal Music Group, Sony Music og Warner Records er blant de mest produktive enhetene som har lagt navnene deres på listen etter å ha gått sammen om å angripe tekst-til-lyd AI-selskapene Udio og Suno.
I sin iver etter å bygge mer avanserte AI-modeller virker det som om teknologiselskapene har inntatt en "be om tilgivelse, ikke tillatelse"-tilnærming til datainnsamling.
Sammenslåingen av Microsoft og Reflection
Mens YouTube-skandalen utspiller seg, har Microsofts nylige ansettelser fra AI-oppstartsbedriften Inflection fått britiske tilsynsmyndigheter til å sperre øynene opp.
Konkurranse- og markedstilsynet (CMA) har satt i gang en første fase av fusjonsetterforskningen for å undersøke om denne masseansettelsen utgjør en de facto-fusjon som kan kvele konkurransen i AI-sektoren.
Dette gjennomtenkte grepet fra Microsoft inkluderte og kjøper medstifteren av Inflection, Mustafa Suleyman (tidligere Google DeepMind-sjef) og en betydelig del av de ansatte i oppstartsbedriften.
Inflection markedsførte seg en gang som et stolt, uavhengig AI-laboratorium. De viste seg å være en utdøende rase.
Det får ekstra tyngde når man tar i betraktning Microsofts eksisterende partnerskap på AI-feltet. Selskapet har allerede investert til sammen rundt $13 milliarder kroner i OpenAI, noe som reiser spørsmål om markedskonsentrasjon.
Microsoft trakk seg nylig tilbake fra sin plan om å sete uten stemmerett ved OpenAI. Eksperter sier at dette sannsynligvis skyldes en beslutning om å begrense selskapets tilsyn for å blidgjøre antitrustmyndighetene.
Alex Haffner, konkurransepartner i advokatfirmaet Fladgate, sa om Microsofts overraskende beslutning"Det er vanskelig å ikke konkludere med at Microsofts beslutning har blitt sterkt påvirket av den pågående konkurranse- og antitrustgranskningen av Microsofts (og andre store teknologiaktørers) innflytelse over nye AI-aktører som OpenAI."
Et tillitsunderskudd?
Både datautvinningsskandalen på YouTube og Microsofts ansettelsespraksis bidrar til en økende tillitsunderskudd mellom Big Tech og offentligheten.
En umiddelbar effekt er at innholdsskaperne har blitt mer forsiktige med arbeidet sitt i frykt for å bli utnyttet.
Dette kan ha en dominoeffekt på innholdsproduksjon og -deling, og til syvende og sist utarme selve plattformene som teknologiselskapene er avhengige av for å skaffe data.
På samme måte bidrar konsentrasjonen av AI-talenter i noen få store selskaper til å homogenisere AI-utviklingen og begrense mangfoldet.
For teknologiselskaper vil gjenoppbygging av tillit sannsynligvis kreve mer enn bare overholdelse av fremtidige reguleringer og antitrust-undersøkelser.
Spørsmålene henger igjen: Kan vi utnytte det virkelige potensialet i kunstig intelligens samtidig som vi ivaretar etikk, rettferdig konkurranse og offentlig tillit?