DAI#45 - Ny topmodel, retssagsblues og forvirret AI

28. juni 2024

Velkommen til denne uges oversigt over håndlavede, skræddersyede AI-nyheder.

I denne uge slog Anthropic OpenAI af pinden.

AI-lydgeneratorer står over for musikken i retten.

Og de bedste LLM'er kæmper med et puslespil, som dine børn kan løse.

Lad os se nærmere på det.

Claude vs GPT-4o

Efter måneder med AI-modeller, der hævder at være "næsten lige så gode som GPT-4", har vi endelig fået en model, der skubber OpenAI væk fra sin topplacering på ranglisten.

Anthropic frigivet Claude Sonnet 3.5Det er en opgraderet version af den mellemstore Claude-model. MMLU-benchmark-testene viser, at den slår GPT-4o og Googles Gemini 1.5 Pro i næsten alle test.

Med en endnu mere kraftfuld Claude Opus 3.5, der forventes snart, hvad vil OpenAI's svar så være?

Efter at Meta aflyste sin lancering af Meta AI i EU, gør Apple det samme på grund af strenge love i regionen.

Apple har forsinket udrulningen af sin Apple Intelligens der, mens EU's teknologifans ser resten af verden få førsteret.

Det lyder bekendt...

AI-virksomheder bliver sagsøgt, og for en gangs skyld er det ikke OpenAI eller Meta.

Tekst-til-lyd-platformene Suno og Udio skaber imponerende musik, men hvordan er de blevet så gode?

Recording Industry Association of America sagsøger virksomhederneog siger, at de "stjal ophavsretligt beskyttede lydoptagelser" for at træne deres AI. Når dommeren lytter til disse prøveklip, kan det blive en kort dag i retten.

En AI-virksomhed, der bruger ophavsretligt beskyttet materiale til at træne sine modeller uden at betale skaberne? Vi er lige så lidt overraskede, som du er.

At genskabe ophavsretligt beskyttet musik er dog ikke det værste, AI bliver brugt til. En DeepMind-undersøgelse siger, at den førende form for AI-misbrug er skurke, der skaber dybe forfalskninger til manipulation af meninger.

Resten af listen over AI-misbrug er interessant læsning.

Er du sikker på, at det er rigtigt?

AI-modeller er virkelig gode til at generere meget plausible, men helt forkerte oplysninger.

AI-forskere siger, at hallucinationer ikke kan løses, men en undersøgelse fra University of Oxford identificerede, hvornår AI-hallucinationer er mere tilbøjelige til at forekomme.

"Semantisk entropi" kontrollerer AI-modellens tillidsniveau, og det er også min nye høflige måde at sige, at nogen vrøvler.

via GIPHY

Selv de mest avancerede LLM'er finder på ting, når de bliver præsenteret for overraskende enkle gåder. I denne uge sendte brugere på X eksempler på, hvordan De smarteste modeller kan ikke løse en simpel flodkrydsning..

Er det et bevis på, at LLM'er ikke er gode til at ræsonnere, eller sker der noget andet her?

AI har måske svært ved at løse nogle gåder, men den kender dig bedre, end du tror. En ny undersøgelse viste, at en AI-system kan forudsige, hvor nervøs du er fra hvordan du reagerer på billeder.

Disse modellers evne til at udlede menneskelige følelser kan være meget nyttig, men kan også være en kilde til menneskelig angst.

Åben sæson for AI

Når AI-virksomheder bruger ordet "åben" til at beskrive deres modeller, betyder det sjældent det, du tror, det gør.

Hvor "åbne" er disse AI-modeller? Sam kiggede nærmere på Hvilke AI-modeller er virkelig åbne? og hvorfor nogle virksomheder holder visse aspekter meget lukkede.

I denne uge skete der en spændende udvikling inden for åbne modeller. EvolutionaryScale's ESM3 er en generativ model for biologi, der forvandler prompts til proteiner.

Tidligere måtte forskere, der ledte efter et nyt protein, vente på, at naturen fandt på det, eller forsøge sig med en hit-or-miss-tilgang i laboratoriet.

Nu gør ESM3 det muligt for forskere at programmere biologi og skabe proteiner ud over naturen.

AI-begivenheder

Hvis du vil øge din markedsføringsindsats, så tjek MarTech Summit Hong Kong 2024 der finder sted den 9. juli.

AI Accelerator Institute præsenterer Generativ AI-topmøde i Austin 2024 den 10. juli. På dagsordenen er industriledere, der diskuterer de seneste tendenser inden for generative AI-applikationer i den virkelige verden.

Andre nyheder...

Her er nogle andre klikværdige AI-historier, som vi nød i denne uge:

Og så er det slut.

Har du prøvet den opgraderede Claude? Artifacts-vinduet er virkelig cool. Det er helt sikkert, at ChatGPT meget snart får en lignende funktion.

Jeg elsker at lege med Udio og Suno, men der er ingen tvivl om, at de stjæler ophavsretligt beskyttet musik. Er det prisen for fremskridt, eller er det en showstopper?

Jeg er stadig overrasket over, at AI-modeller kæmper med et simpelt flodkrydsningspuslespil. Det bør vi nok løse, før vi lader AI styre virkelig vigtige ting som elnet eller hospitaler.

Fortæl os, hvad du synes, og bliv ved med at sende os links til interessante AI-nyheder og -forskning, som vi måske har overset.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

Ingen kategorier fundet.
×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser