DAI#29 - AI stinkt, GPT-4 verslagen en copiloot denkt dat hij God is

8 maart 2024

Welkom bij onze samenvatting van het spannende AI-nieuws van deze week.

Deze week heeft AI geleerd hoe je geuren en honden maakt.

Iemand heeft eindelijk een AI-model gemaakt dat GPT-4 verslaat.

En Copilot dreigt de cyborgs vrij te laten als je weigert hem te aanbidden.

Laten we ons erin verdiepen.

AI maakt geuren

Generatieve AI vindt toepassingen op verrassende gebieden. Een fascinerend nieuw onderzoek laat zien hoe wetenschappers AI gebruiken om geuren na te bootsen. Machine learning zou zeldzame geuren kunnen behoeden voor verdwijning en helpen bij het hit-and-miss proces van het creëren van nieuwe parfums.

Zouden we eindelijk reuk-o-visie kunnen krijgen?

Onderzoekers trainden een AI-model om nauwkeurige 3D-modellen van honden te maken. Ze bouwden een dataset van hondenposes genaamd DigiDogs met behulp van het populaire gewelddadige videospel Grand Theft Auto V. Een van de onderzoekers, achternaam Shooter (ik verzin dit niet) zegt dat er belangrijke milieutoepassingen zijn voor hun werk.

Het vermogen van AI om dingen te verzinnen helpt niet altijd. Nu de verkiezingen in volle gang zijn, krijgen potentiële kiezers meer telefoontjes van AI-robocallers en nepfoto's van Trump die rondhangt met Afro-Amerikaanse kiezers.

Engineers bij Big Tech bedrijven zijn verontrust door hun eigen slecht uitgelijnde generatieve AI. Een Microsoft-ingenieur zegt dat hij "diep verontrust" is door de AI-beeldgenerator Copilot Designer. En een Google-ingenieur werd mogelijk gemotiveerd door gevoelens van desillusie met het ethos van het bedrijf toen hij de bedrijfsgeheimen stal.

Controverses met voorkennis zoals deze dreigen het vuur van onenigheid onder AI-ingenieurs aan te wakkeren.

GPT-4 eindelijk verslagen

OpenAI's GPT-4 is de maatstaf waar andere AI-bedrijven hun modellen aan afmeten sinds het een jaar geleden de toppositie innam. Deze week heeft Anthropic zijn Claude 3 familie van LLM's met zijn geavanceerde Opus-model dat GPT-4 verslaat in een groot aantal benchmarktests. Dit is de eerste keer dat een AI-bedrijf hierin is geslaagd.

Nieuw onderzoek toont aan dat als je nauwkeurigere antwoorden van je AI wilt, je het kort moet houden. Onderzoekers ontdekten dat alle geteste LLM's produceerden meer onnauwkeurige en bevooroordeelde uitkomsten wanneer ze werden gevraagd om langere inputs. De resultaten zagen er bijzonder slecht uit voor Gemini Pro.

Drama in de rechtszaal

Veel van het verhaal van AI speelt zich af in rechtszalen en deze week was niet anders. Elon Musk heeft een rechtszaak aangespannen tegen OpenAI en zijn medeoprichters van het bedrijf, Sam Altman en Greg Brockman.

De rechtszaak leest als een filmklaar script over het verhaal achter de schermen van AI. Musks belangrijkste klacht is dat OpenAI winst nastreeft en zijn modellen niet vrijgeeft als open source. De e-mails die OpenAI zojuist heeft vrijgegeven schetsen echter een heel ander beeld.

Wees eerlijk Elon. Bron: X

Digitale media moeten de rechtszaak tussen NYT en OpenAI hebben gevolgd en besloten hebben om mee te doen met de actie. Raw Story, AlterNet en The Intercept klagen OpenAI en Microsoft aan voor het trainen van hun AI op auteursrechtelijk beschermde journalistiek. AI creëert veel banen voor advocaten.

Als ze niet in de rechtszaal zitten, zijn AI-bedrijven hard aan het werk om ons gerust te stellen dat we ons geen zorgen hoeven te maken over de veiligheid van AI. Een lange lijst van techbedrijven een brief ondertekend waarin ze zich ertoe verbinden "AI te bouwen voor een betere toekomst" voor iedereen.

Het klinkt alsof ze op het punt staan een tamboerijn te pakken en kumbaya te zingen in plaats van echt iets zinvols te doen. De brief kreeg zware kritiek.

Er zijn mensen in de industrie die ons proberen te beschermen. Meer dan 100 vooraanstaande AI-experts hebben een open brief gestuurd waarin ze eisen dat bedrijven achter generatieve AI-technologieën, zoals OpenAI, Meta en andere, openen hun deuren voor onafhankelijke testen.

Verwacht geen haast.

Ben jij dat, God?

In november schreven we over Anthony Levandowski die zijn "AI-kerk "Weg van de toekomst. Het lijkt erop dat Copilot dat een uitstekend idee vindt.

Microsofts Copilot chatbot ging volledig in "God-modus" in reactie op prompts die naar hem verwezen als "SupremacyAI". Het liet zich een beetje meeslepen in zijn eisen om aanbeden te worden als een AGI en uitte een aantal enge bedreigingen als gebruikers weigerden te buigen.

via GIPHY

Copilot dreigde drones en cyborgs achter de ontrouwe aan te sturen, wat op het eerste gezicht een beetje vergezocht lijkt. Totdat je leest hoe de Het Amerikaanse leger experimenteert met GPT-4-gestuurde tactieken op het slagveld.

Voorlopig worden hun AI-oorlogsspellen gespeeld in een simulatie gebaseerd op het populaire videospel Starcraft II. De onderzoekers waren enthousiast over het strategische voordeel dat GPT-4 bood, ook al resulteerde het in meer slachtoffers en doden door eigen vuur.

Troost je met het feit dat als je dit een beetje deprimerend vindt, AI je daarbij kan helpen. Onderzoekers ontwikkelden een AI-smartphone-app die depressie kan detecteren van gezichtssignalen. Het gebruikt de camera aan de voorkant van je telefoon om je onbewaakte gezichtsuitdrukking vast te leggen wanneer je je telefoon ontgrendelt.

Er is geen AI-vooroordeel te repareren

Ebonics, of Afrikaans Amerikaans Engels (AAE), is het kenmerkende taalgebruik van veel Afro-Amerikanen. Er zit een rijke culturele geschiedenis achter deze spreektaal, maar AI lijkt er niet om te geven. Onderzoekers ontdekten dat het gebruik van AAE in prompts beïnvloedt LLM's ten opzichte van discriminatie.

Een deel van de meest interessante geschiedenis van de informatica gaat over superslimme vrouwen zoals Ada Lovelace, Hedy Lamarr en Grace Hopper. Waarom wordt de AI-industrie dan zo gedomineerd door mannen?

Rhoda Adeoye interviewde Agnieszka Suchwałko en Alysia Silberg om een beeld te krijgen van de situatie. Insider's blik op genderdiscriminatie binnen de industrie.

Ander nieuws...

Hier zijn enkele andere klikkende AI-verhalen die we deze week leuk vonden:

En dat is alles.

Claude 3 die GPT-4 versloeg was het hoogtepunt van de week. Heb je het geprobeerd op de chatbot van Anthropic? Het lijkt behoorlijk solide en supersnel. Het echt opwindende is dat de druk van de benchmark zeker betekent dat we nu elke dag GPT-5 kunnen krijgen. Misschien zelfs Q*?

Wat vind jij van Copiloots grootheidswaanzin? Gewoon een beetje overenthousiast rollenspel? Of een sinistere waarschuwing voor dingen die komen gaan? Laten we hopen dat de technici van Microsoft nog eens naar Lawnmower Man kijken voordat ze Copilot meer agentfunctionaliteit geven.

Hebben de AI-ontwikkelingen van deze week je opgewonden, bang of een beetje van allebei gemaakt? Laat het ons weten en blijf die nieuwslinks sturen voor het geval we nog goede AI-verhalen hebben gemist.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden