OpenAI heeft GPT-4o mini onthuld, een kleinere en meer kosteneffectieve versie van zijn krachtige GPT-4o model.
GPT-4o mini wordt aangeprezen als "het meest kostenefficiënte kleine model op de markt", met prijzen die de concurrentie drastisch onderbieden.
Ontwikkelaars betalen slechts $0,15 per miljoen input tokens en $0,60 per miljoen output tokens, vergeleken met respectievelijk $5,00 en $15,00 voor GPT-4o.
Olivier Godement, OpenAI's hoofd van Product, API, besprak het potentieel van het model met VentureBeat: "De kosten per intelligentie zijn zo goed dat ik verwacht dat het gebruikt gaat worden voor allerlei soorten klantenservice, software engineering, creatief schrijven, allerlei soorten taken."
Ondanks de "mini" heeft GPT-4o mini indrukwekkende mogelijkheden. Het presteert beter dan GPT-3.5 Turbo op verschillende benchmarks en kan zowel tekst- als beeldinvoer verwerken.
OpenAI rapporteert dat GPT-4o mini een 82.0% score behaalt op de Massive Multitask Language Understanding (MMLU) benchmark, en daarmee concurrenten als Google's Gemini 1.5 Flash (77.9%) en Anthropic's Claude 3 Haiku (73.8%) overtreft.
Het model vervangt GPT-3.5 Turbo voor abonnees van ChatGPT Plus en Teams en biedt gebruikers een krachtiger model zonder extra kosten.
Early adopters, waaronder startups Ramp en Superhuman, hebben veelbelovende resultaten gemeld voor taken als het categoriseren van kassabonnen en gepersonaliseerde e-mailreacties.
OpenAI wil de veiligheid van GPT-4o mini bevestigen
OpenAI verlegt de grenzen met de mogelijkheden en betaalbaarheid van de GPT-4o mini, maar beknibbelt niet op veiligheid. Het gebruikt dezelfde mechanismen die het ontwikkelde voor het grotere GPT-4o model.
OpenAI heeft ook meer dan 70 experts op het gebied van sociale psychologie en misinformatie ingeschakeld om GPT-4o aan de tand te voelen.
Deze specialisten hielpen potentiële risico's te identificeren, waardoor het team problemen kon aanpakken voordat het problemen werden. De lessen werden verwerkt in GPT-4o mini.
OpenAI introduceerde ook wat zij noemen de "instructie hiërarchie" methode, die "helpt om het model beter bestand te maken tegen jailbreaks, prompt injecties en systeem prompt extracties. Dit maakt de reacties van het model betrouwbaarder en maakt het veiliger om te gebruiken in applicaties op schaal."
Dat is waarschijnlijk een verkooppraatje voor zakelijke gebruikers die koste wat het kost foutieve resultaten en hallucinaties willen vermijden.
In de toekomst is OpenAI van plan om de mogelijkheden van GPT-4o mini uit te breiden, waaronder de mogelijkheid om beelden, audio en video te genereren. Het model zal ook verkrijgbaar zijn via Apple Intelligentie dit najaar, samenvallend met de release van iOS 18.
Terwijl GPT-4o mini behoorlijk opwindend is, heeft OpenAI te kampen gehad met tegenslagen op andere gebieden. Het bedrijf heeft onlangs de release van spraak- en emotie-leesfuncties voor ChatGPT uitgesteld, vanwege de behoefte aan aanvullende veiligheidstests.
Mensen waren stomverbaasd toen het bedrijf een demonstratie gaf van GPT-4o en zijn spraaksynthesemaar sindsdien is het rustig.
Niettemin bewijst GPT-4o mini dat de mensen bij OpenAI nog steeds hard aan het werk zijn, ondanks een handvol recente controverses.