OpenAI har afsløret GPT-4o mini, en mindre og mere omkostningseffektiv version af den kraftfulde GPT-4o-model.
GPT-4o mini udråbes som "den mest omkostningseffektive lille model på markedet" med priser, der ligger langt under konkurrenternes.
Udviklere betaler kun $0,15 pr. million input-tokens og $0,60 pr. million output-tokens, sammenlignet med henholdsvis $5,00 og $15,00 for GPT-4o.
Olivier Godement, OpenAI's produktchef for API, diskuterede modellens potentiale med VentureBeat: "Omkostningerne pr. intelligens er så gode, at jeg forventer, at det vil blive brugt til alle former for kundesupport, softwareudvikling, kreativ skrivning, alle mulige opgaver."
På trods af "mini" har GPT-4o mini imponerende evner. Den overgår GPT-3.5 Turbo på forskellige benchmarks og kan håndtere både tekst- og billedinput.
OpenAI rapporterer, at GPT-4o mini opnår en score på 82,0% på Massive Multitask Language Understanding (MMLU)-benchmarket og dermed overgår konkurrenter som Googles Gemini 1.5 Flash (77,9%) og Anthropics Claude 3 Haiku (73,8%).
Modellen skal erstatte GPT-3.5 Turbo for ChatGPT Plus- og Teams-abonnenter og tilbyder brugerne en mere kraftfuld model uden ekstra omkostninger.
De første brugere, herunder de nystartede virksomheder Ramp og Superhuman, har rapporteret om lovende resultater for opgaver som kategorisering af kvitteringer og personlige e-mailsvar.
OpenAI er opsat på at bekræfte GPT-4o minis sikkerhed
Mens OpenAI skubber til grænserne med GPT-4o minis evner og overkommelige pris, sparer de ikke på sikkerheden. Den bruger de samme mekanismer, som blev udviklet til den større GPT-4o-model.
OpenAI inddrog også over 70 eksperter fra områder som socialpsykologi og misinformation for at sætte GPT-4o på prøve.
Disse specialister hjalp med at identificere potentielle risici, så teamet kunne løse problemerne, før de blev til problemer. Erfaringerne blev indarbejdet i GPT-4o mini.
OpenAI introducerede også det, de kalder "instruktionshierarki-metoden", som "hjælper med at forbedre modellens evne til at modstå jailbreaks, prompt-injektioner og udtræk af systemprompter. Det gør modellens svar mere pålidelige og hjælper med at gøre den mere sikker at bruge i applikationer i stor skala."
Det er nok et oplæg til virksomhedsbrugere, som for enhver pris vil undgå fejlagtige resultater og hallucinationer.
Fremover planlægger OpenAI at udvide GPT-4o minis muligheder, herunder dens evne til at generere billed-, lyd- og videooutput. Modellen er også planlagt til at være tilgængelig gennem Apple Intelligens til efteråret, samtidig med udgivelsen af iOS 18.
Mens GPT-4o mini er ret spændende, har OpenAI oplevet tilbageslag på andre områder. Virksomheden forsinkede for nylig udgivelsen af stemme- og følelseslæsningsfunktioner til ChatGPT med henvisning til behovet for yderligere sikkerhedstest.
Folk var forbløffede, da virksomheden demonstrerede GPT-4o og dens talesynteseMen siden da er der kommet ro på.
Ikke desto mindre viser GPT-4o mini, at folk hos OpenAI stadig arbejder hårdt på trods af en håndfuld nylige kontroverser.