DAI#45 - Ny toppmodell, stämningsblues och förbryllad AI

Välkommen till veckans sammanställning av handmonterade skräddarsydda AI-nyheter.

I veckan slog Anthropic ut OpenAI från pole position.

AI-ljudgeneratorer får stå sitt kast i domstol.

Och de bästa LLM:erna kämpar med ett pussel som dina barn kan lösa.

Låt oss gräva i det.

Claude vs GPT-4o

Efter månader av AI-modeller som hävdat att de är "nästan lika bra som GPT-4" har vi äntligen fått en modell som knuffar ner OpenAI från sin topplacering på topplistorna.

Anthropic släppt Claude Sonett 3.5MMLU är en uppgraderad version av den medelstora Claude-modellen. I MMLU:s benchmarktester slår den GPT-4o och Googles Gemini 1.5 Pro i nästan alla tester.

Med en ännu kraftfullare Claude Opus 3.5 som förväntas snart, vad kommer OpenAI att svara på?

Claude 3.5 Sonnet är inte som de andra LLM:erna 💁‍♀️

11 imponerande demonstrationer av den nya modellen: pic.twitter.com/2oHZdArz6J

- Proper (@ProperPrompter) 26 juni 2024

Efter att Meta avbröt sin lansering av Meta AI i EU gör Apple detsamma på grund av strikta lagar i regionen.

Apple har försenat lanseringen av sitt Apple Intelligens där vi som EU:s teknikfans ser på när resten av världen får första tjing.

Låter bekant...

AI-företag blir stämda, och för en förändring är det inte OpenAI eller Meta.

Text-till-ljud-plattformarna Suno och Udio genererar imponerande musik, men hur blev de så bra?

The Recording Industry Association of America stämmer företagenoch säger att de "stal upphovsrättsskyddade ljudinspelningar" för att träna sin AI. När domaren lyssnar på dessa exempelklipp kan det bli en kort dag i rätten.

Ett AI-företag som använder upphovsrättsskyddat material för att träna sina modeller utan att betala upphovsmännen? Vi är lika lite förvånade som du är.

Att återskapa upphovsrättsskyddad musik är dock inte det värsta som AI används till. En DeepMind-studie säger att den främsta formen av AI-missbruk är skurkar som skapar djupa förfalskningar för opinionsmanipulation.

Resten av listan över AI-missbruk är intressant läsning.

Är du säker på att det är rätt?

AI-modeller är riktigt bra på att generera mycket trovärdig men helt felaktig information.

AI-forskare säger att hallucinationer inte kan åtgärdas men en studie från University of Oxford identifierade när AI-hallucinationer är mer benägna att inträffa.

"Semantisk entropi" kontrollerar AI-modellens konfidensnivå och det är också mitt nya artiga sätt att säga att någon snackar skit.

via GIPHY

Även de mest avancerade LLM:erna hittar på saker när de ställs inför förvånansvärt enkla pussel. Den här veckan publicerade användare på X exempel på hur de smartaste modellerna kan inte lösa ett enkelt flodövergångspussel.

Är det bevis för att LLM:er inte är bra på att resonera, eller är det något annat som händer här?

AI kan ha svårt med vissa gåtor, men den känner dig bättre än du tror. En ny studie visade att en AI-system kan förutsäga hur orolig du är från hur du reagerar på foton.

Dessa modellers förmåga att härleda mänskliga känslor kan vara till stor hjälp, men kan också vara en källa till oro för människor.

AI öppen säsong

När AI-företag använder ordet "öppen" för att beskriva sina modeller betyder det sällan vad du tror att det gör.

Hur "öppna" är dessa AI-modeller? Sam tog en närmare titt på vilka AI-modeller som verkligen är öppna och varför vissa företag håller vissa aspekter mycket stängda.

I veckan skedde en spännande utveckling inom området öppna modeller. EvolutionaryScale's ESM3 är en generativ modell för biologi som förvandlar uppmaningar till proteiner.

Tidigare var forskare som letade efter ett nytt protein tvungna att vänta på att naturen skulle komma på det eller försöka sig på en hit-or-miss-strategi i labbet.

Nu gör ESM3 det möjligt för forskare att programmera biologi och skapa proteiner bortom naturen.

AI-händelser

Om du vill höja nivån på dina marknadsföringsinsatser ska du kolla in MarTech Summit Hong Kong 2024 som äger rum den 9 juli.

AI Accelerator Institute presenterar den Generativ AI-toppmöte Austin 2024 den 10 juli. På agendan står branschledare som diskuterar de senaste trenderna inom generativa AI-tillämpningar i verkliga livet.

Andra nyheter...

Här är några andra klickvärda AI-berättelser som vi gillade den här veckan:

Meta är felaktigt märkning av riktiga foton som "Made by AI.
SoftBanks VD säger att AI som är 10.000 gånger smartare än människan kommer att komma ut om 10 år.
OpenAI försenar lanseringen av GPT-4o:s röstassistent för att hantera säkerhetsfrågor.
Antropiska debuterar verktyg för samarbete för sin AI-assistent Claude.
Kinesiska AI-företag uppvaktar OpenAI användare eftersom det amerikanska företaget planerar API-begränsningar.
OpenAI förvärvar samarbetsverktyg för skärmdelning skapare Multi.
Toys "R" Us får mothugg på nätet efter att ha släppt en annons skapad med OpenAI's Sora.

den här Toys r us-reklamen är helt och hållet gjord med AI, vilket innebär att barnet är äckligt och ohyggligt, känslan ihålig och Toys r us-varumärket är dött för minst tredje gången pic.twitter.com/IRprWZKN8O

- Chris Alsikkan ™ (@AlsikkanTV) 25 juni 2024

Och det var allt.

Har du provat den uppgraderade Claude? Artifacts-fönstret är allvarligt coolt. Det är en säker satsning att ChatGPT kommer att få en liknande funktion mycket snart.

Jag älskar att spela med Udio och Suno men det går inte att förneka att de stjäl upphovsrättsskyddad musik. Är detta priset för framsteg eller är det en showstopper?

Jag är fortfarande förvånad över att AI-modeller kämpar med ett enkelt flodövergångspussel. Vi borde nog åtgärda det innan vi låter AI kontrollera riktigt viktiga saker som elnät eller sjukhus.

Låt oss veta vad du tycker och fortsätt att skicka oss länkar till intressanta AI-nyheter och forskning som vi kanske har missat.

DAI#45 - Ny toppmodell, stämningsblues och förbryllad AI

Claude vs GPT-4o

Låter bekant...

Är du säker på att det är rätt?

AI öppen säsong

AI-händelser

Andra nyheter...

Bli en del av framtiden

Eugene van der Watt

DAI#45 - Ny toppmodell, stämningsblues och förbryllad AI

Claude vs GPT-4o

Låter bekant...

Är du säker på att det är rätt?

AI öppen säsong

AI-händelser

Andra nyheter...

Bli en del av framtiden

Eugene van der Watt

GRATIS PDF EXKLUSIVLigg steget före med DailyAI

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI