OpenAI har avduket GPT-4o mini, en mindre og mer kostnadseffektiv versjon av den kraftige GPT-4o-modellen.
GPT-4o mini blir omtalt som "den mest kostnadseffektive lille modellen på markedet", med priser som ligger dramatisk under konkurrentenes.
Utviklere betaler kun $0,15 per million input-tokens og $0,60 per million output-tokens, sammenlignet med henholdsvis $5,00 og $15,00 for GPT-4o.
Olivier Godement, OpenAIs produktsjef for API, diskuterte modellens potensial med VentureBeat: "Kostnaden per intelligens er så god at jeg forventer at den kommer til å bli brukt til alle slags oppgaver som kundesupport, programvareteknikk, kreativ skriving, alle slags oppgaver."
Til tross for "mini" har GPT-4o mini imponerende egenskaper. Den overgår GPT-3.5 Turbo i ulike benchmarks og kan håndtere både tekst- og bildeinnganger.
OpenAI rapporterer at GPT-4o mini oppnår en poengsum på 82,0% på Massive Multitask Language Understanding (MMLU) benchmark, og overgår dermed konkurrenter som Googles Gemini 1.5 Flash (77,9%) og Anthropics Claude 3 Haiku (73,8%).
Modellen skal erstatte GPT-3.5 Turbo for ChatGPT Plus- og Teams-abonnenter, og tilbyr brukerne en kraftigere modell uten ekstra kostnad.
Tidlige brukere, deriblant oppstartsbedriftene Ramp og Superhuman, har rapportert om lovende resultater for oppgaver som kategorisering av kvitteringer og personaliserte e-postsvar.
OpenAI er opptatt av å hevde GPT-4o minis sikkerhet
Selv om OpenAI flytter grensene med GPT-4o minis muligheter og rimelige pris, sparer de ikke på sikkerheten. Den bruker de samme mekanismene som ble utviklet for den større GPT-4o-modellen.
OpenAI har også hentet inn over 70 eksperter fra felt som sosialpsykologi og feilinformasjon for å sette GPT-4o på prøve.
Disse spesialistene bidro til å identifisere potensielle risikoer, slik at teamet kunne ta tak i problemene før de ble til problemer. Erfaringene ble tatt med i GPT-4o mini.
OpenAI introduserte også det de kaller "instruksjonshierarki"-metoden, som "bidrar til å forbedre modellens evne til å motstå jailbreaks, prompt-injeksjoner og uttrekk av systemprompter. Dette gjør modellens svar mer pålitelige og bidrar til å gjøre den tryggere å bruke i applikasjoner i stor skala."
Det er sannsynligvis et argument for bedriftsbrukere som for enhver pris vil unngå feilaktige resultater og hallusinasjoner.
Fremover planlegger OpenAI å utvide GPT-4o minis funksjoner, blant annet muligheten til å generere bilder, lyd og video. Modellen er også planlagt å være tilgjengelig gjennom Apple Etterretning denne høsten, samtidig med lanseringen av iOS 18.
Mens GPT-4o mini er ganske spennende, har OpenAI møtt tilbakeslag på andre områder. Selskapet utsatte nylig lanseringen av stemme- og følelsesavlesningsfunksjoner for ChatGPT, med henvisning til behovet for ytterligere sikkerhetstesting.
Folk ble forbløffet da selskapet demonstrerte GPT-4o og dens talesynteseMen siden har det blitt roligere.
GPT-4o mini viser likevel at folkene hos OpenAI fortsatt jobber hardt, til tross for en håndfull kontroverser i det siste.