OpenAI har presenterat GPT-4o mini, en mindre och mer kostnadseffektiv version av den kraftfulla GPT-4o-modellen.
GPT-4o mini marknadsförs som "den mest kostnadseffektiva lilla modellen på marknaden", med priser som dramatiskt underskrider konkurrenternas.
Utvecklare kommer att betala endast $0,15 per miljon input tokens och $0,60 per miljon output tokens, jämfört med $5,00 respektive $15,00 för GPT-4o.
Olivier Godement, OpenAI:s produktchef för API, diskuterade modellens potential med VentureBeat: "Kostnaden per intelligens är så bra att jag förväntar mig att den kommer att användas för alla typer av kundsupport, mjukvaruutveckling, kreativt skrivande, alla typer av uppgifter."
Trots "mini" har GPT-4o mini imponerande kapacitet. Den överträffar GPT-3.5 Turbo i olika benchmarks och kan hantera både text- och bildinmatning.
OpenAI rapporterar att GPT-4o mini uppnår en poäng på 82,0% på Massive Multitask Language Understanding (MMLU) benchmark, vilket överträffar konkurrenter som Googles Gemini 1.5 Flash (77,9%) och Anthropics Claude 3 Haiku (73,8%).
Modellen kommer att ersätta GPT-3.5 Turbo för ChatGPT Plus- och Teams-abonnenter och erbjuder användarna en kraftfullare modell utan extra kostnad.
Tidiga användare, bland annat de nystartade företagen Ramp och Superhuman, har rapporterat lovande resultat för uppgifter som kategorisering av kvitton och personliga e-postsvar.
OpenAI är angeläget om att säkerställa GPT-4o minis säkerhet
Även om OpenAI tänjer på gränserna med GPT-4o minis kapacitet och prisvärdhet, snålar de inte på säkerheten. Den använder samma mekanismer som utvecklades för den större GPT-4o-modellen.
OpenAI tog också in över 70 experter från områden som socialpsykologi och felaktig information för att sätta GPT-4o på prov.
Dessa specialister hjälpte till att identifiera potentiella risker, vilket gjorde det möjligt för teamet att ta itu med frågor innan de blev problem. Lärdomarna fördes in i GPT-4o mini.
OpenAI introducerade också vad de kallar metoden "instruktionshierarki", som "hjälper till att förbättra modellens förmåga att motstå jailbreaks, promptinjektioner och systempromptextraktioner. Detta gör modellens svar mer tillförlitliga och bidrar till att göra den säkrare att använda i applikationer i stor skala."
Det är förmodligen ett argument för företagsanvändare som till varje pris vill undvika felaktiga resultat och hallucinationer.
Framöver planerar OpenAI att utöka GPT-4o minis kapacitet, inklusive dess förmåga att generera bild-, ljud- och videoutdata. Modellen kommer också att vara tillgänglig via Apple Intelligens i höst, vilket sammanfaller med lanseringen av iOS 18.
Medan GPT-4o mini är ganska spännande har OpenAI mött bakslag på andra områden. Företaget försenade nyligen lanseringen av röst- och känsloläsningsfunktioner för ChatGPT, med hänvisning till behovet av ytterligare säkerhetstester.
Folk blev förbluffade när företaget demonstrerade GPT-4o och dess talsyntesmen sedan dess har det lugnat ner sig.
Ändå bevisar GPT-4o mini att människor på OpenAI fortfarande arbetar hårt trots en handfull senaste kontroverser.