DAI#45 - Ny toppmodell, stämningsblues och förbryllad AI

28 juni 2024

Välkommen till veckans sammanställning av handmonterade skräddarsydda AI-nyheter.

I veckan slog Anthropic ut OpenAI från pole position.

AI-ljudgeneratorer får stå sitt kast i domstol.

Och de bästa LLM:erna kämpar med ett pussel som dina barn kan lösa.

Låt oss gräva i det.

Claude vs GPT-4o

Efter månader av AI-modeller som hävdat att de är "nästan lika bra som GPT-4" har vi äntligen fått en modell som knuffar ner OpenAI från sin topplacering på topplistorna.

Anthropic släppt Claude Sonett 3.5MMLU är en uppgraderad version av den medelstora Claude-modellen. I MMLU:s benchmarktester slår den GPT-4o och Googles Gemini 1.5 Pro i nästan alla tester.

Med en ännu kraftfullare Claude Opus 3.5 som förväntas snart, vad kommer OpenAI att svara på?

Efter att Meta avbröt sin lansering av Meta AI i EU gör Apple detsamma på grund av strikta lagar i regionen.

Apple har försenat lanseringen av sitt Apple Intelligens där vi som EU:s teknikfans ser på när resten av världen får första tjing.

Låter bekant...

AI-företag blir stämda, och för en förändring är det inte OpenAI eller Meta.

Text-till-ljud-plattformarna Suno och Udio genererar imponerande musik, men hur blev de så bra?

The Recording Industry Association of America stämmer företagenoch säger att de "stal upphovsrättsskyddade ljudinspelningar" för att träna sin AI. När domaren lyssnar på dessa exempelklipp kan det bli en kort dag i rätten.

Ett AI-företag som använder upphovsrättsskyddat material för att träna sina modeller utan att betala upphovsmännen? Vi är lika lite förvånade som du är.

Att återskapa upphovsrättsskyddad musik är dock inte det värsta som AI används till. En DeepMind-studie säger att den främsta formen av AI-missbruk är skurkar som skapar djupa förfalskningar för opinionsmanipulation.

Resten av listan över AI-missbruk är intressant läsning.

Är du säker på att det är rätt?

AI-modeller är riktigt bra på att generera mycket trovärdig men helt felaktig information.

AI-forskare säger att hallucinationer inte kan åtgärdas men en studie från University of Oxford identifierade när AI-hallucinationer är mer benägna att inträffa.

"Semantisk entropi" kontrollerar AI-modellens konfidensnivå och det är också mitt nya artiga sätt att säga att någon snackar skit.

via GIPHY

Även de mest avancerade LLM:erna hittar på saker när de ställs inför förvånansvärt enkla pussel. Den här veckan publicerade användare på X exempel på hur de smartaste modellerna kan inte lösa ett enkelt flodövergångspussel.

Är det bevis för att LLM:er inte är bra på att resonera, eller är det något annat som händer här?

AI kan ha svårt med vissa gåtor, men den känner dig bättre än du tror. En ny studie visade att en AI-system kan förutsäga hur orolig du är från hur du reagerar på foton.

Dessa modellers förmåga att härleda mänskliga känslor kan vara till stor hjälp, men kan också vara en källa till oro för människor.

AI öppen säsong

När AI-företag använder ordet "öppen" för att beskriva sina modeller betyder det sällan vad du tror att det gör.

Hur "öppna" är dessa AI-modeller? Sam tog en närmare titt på vilka AI-modeller som verkligen är öppna och varför vissa företag håller vissa aspekter mycket stängda.

I veckan skedde en spännande utveckling inom området öppna modeller. EvolutionaryScale's ESM3 är en generativ modell för biologi som förvandlar uppmaningar till proteiner.

Tidigare var forskare som letade efter ett nytt protein tvungna att vänta på att naturen skulle komma på det eller försöka sig på en hit-or-miss-strategi i labbet.

Nu gör ESM3 det möjligt för forskare att programmera biologi och skapa proteiner bortom naturen.

AI-händelser

Om du vill höja nivån på dina marknadsföringsinsatser ska du kolla in MarTech Summit Hong Kong 2024 som äger rum den 9 juli.

AI Accelerator Institute presenterar den Generativ AI-toppmöte Austin 2024 den 10 juli. På agendan står branschledare som diskuterar de senaste trenderna inom generativa AI-tillämpningar i verkliga livet.

Andra nyheter...

Här är några andra klickvärda AI-berättelser som vi gillade den här veckan:

Och det var allt.

Har du provat den uppgraderade Claude? Artifacts-fönstret är allvarligt coolt. Det är en säker satsning att ChatGPT kommer att få en liknande funktion mycket snart.

Jag älskar att spela med Udio och Suno men det går inte att förneka att de stjäl upphovsrättsskyddad musik. Är detta priset för framsteg eller är det en showstopper?

Jag är fortfarande förvånad över att AI-modeller kämpar med ett enkelt flodövergångspussel. Vi borde nog åtgärda det innan vi låter AI kontrollera riktigt viktiga saker som elnät eller sjukhus.

Låt oss veta vad du tycker och fortsätt att skicka oss länkar till intressanta AI-nyheter och forskning som vi kanske har missat.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

Inga kategorier hittades.
×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar