OpenAI ha presentato GPT-4o mini, una versione più piccola ed economica del suo potente modello GPT-4o.
GPT-4o mini viene pubblicizzato come "il modello piccolo più conveniente del mercato", con prezzi nettamente inferiori a quelli della concorrenza.
Gli sviluppatori pagheranno solo $0,15 per milione di gettoni di ingresso e $0,60 per milione di gettoni di uscita, rispetto rispettivamente a $5,00 e $15,00 per il GPT-4o.
Olivier Godement, responsabile del prodotto API di OpenAI, ha discusso delle potenzialità del modello con VentureBeat: "Il costo per intelligenza è così buono che mi aspetto che venga utilizzato per tutti i tipi di assistenza clienti, ingegneria del software, scrittura creativa, tutti i tipi di compiti".
Nonostante il nome "mini", GPT-4o mini vanta capacità impressionanti. Supera il GPT-3.5 Turbo in vari benchmark e può gestire sia gli input testuali che quelli visivi.
OpenAI riferisce che GPT-4o mini ha ottenuto un punteggio di 82,0% nel benchmark Massive Multitask Language Understanding (MMLU), superando concorrenti come Gemini 1.5 Flash di Google (77,9%) e Claude 3 Haiku di Anthropic (73,8%).
Il modello è destinato a sostituire GPT-3.5 Turbo per gli abbonati a ChatGPT Plus e Teams, offrendo agli utenti un modello più potente senza costi aggiuntivi.
I primi utilizzatori, tra cui le startup Ramp e Superhuman, hanno riportato risultati promettenti per attività come la categorizzazione delle ricevute e la personalizzazione delle risposte alle e-mail.
OpenAI vuole affermare la sicurezza del GPT-4o mini
Pur spingendosi oltre i limiti delle capacità e dell'economicità del GPT-4o mini, OpenAI non lesina sulla sicurezza. Utilizza gli stessi meccanismi sviluppati per il modello più grande GPT-4o.
OpenAI ha anche coinvolto più di 70 esperti di settori come la psicologia sociale e la disinformazione per mettere alla prova il GPT-4o.
Questi specialisti hanno aiutato a identificare i rischi potenziali, consentendo al team di affrontare i problemi prima che diventassero tali. I risultati sono stati inseriti nel GPT-4o mini.
OpenAI ha anche introdotto quello che chiama il metodo della "gerarchia delle istruzioni", che "aiuta a migliorare la capacità del modello di resistere a jailbreak, iniezioni di prompt ed estrazioni di prompt di sistema. Questo rende le risposte del modello più affidabili e contribuisce a renderne più sicuro l'utilizzo nelle applicazioni su scala."
Probabilmente si tratta di una proposta per gli utenti aziendali che vogliono evitare a tutti i costi risultati errati e allucinazioni.
In prospettiva, OpenAI prevede di espandere le capacità del GPT-4o mini, compresa la capacità di generare immagini, audio e video. Il modello sarà disponibile anche tramite Apple Intelligenza in autunno, in concomitanza con l'uscita di iOS 18.
Mentre il GPT-4o mini è piuttosto eccitante, OpenAI ha affrontato battute d'arresto in altre aree. L'azienda ha recentemente ritardato il rilascio delle funzioni di lettura della voce e delle emozioni per ChatGPT, citando la necessità di ulteriori test di sicurezza.
Le persone sono rimaste sbalordite quando l'azienda ha presentato la demo di GPT-4o e la sua sintesi vocalema da allora le cose si sono calmate.
Tuttavia, GPT-4o mini dimostra che le persone di OpenAI stanno ancora lavorando sodo nonostante le recenti controversie.