OpenAI ha presentado GPT-4o mini, una versión más pequeña y económica de su potente modelo GPT-4o.
GPT-4o mini se presenta como "el modelo pequeño más rentable del mercado", con precios muy inferiores a los de la competencia.
Los promotores pagarán sólo $0,15 por millón de tokens de entrada y $0,60 por millón de tokens de salida, frente a los $5,00 y $15,00 de GPT-4o, respectivamente.
Olivier Godement, Jefe de Producto de API de OpenAI, habló del potencial del modelo con VentureBeat: "El coste por inteligencia es tan bueno que espero que se utilice para todo tipo de tareas de atención al cliente, ingeniería de software, escritura creativa, todo tipo de tareas".
A pesar de ser "mini", GPT-4o mini presume de unas capacidades impresionantes. Supera a GPT-3.5 Turbo en varias pruebas comparativas y puede manejar tanto entradas de texto como de visión.
OpenAI informa de que GPT-4o mini alcanza una puntuación de 82,0% en la prueba de referencia Massive Multitask Language Understanding (MMLU), superando a competidores como Gemini 1.5 Flash de Google (77,9%) y Claude 3 Haiku de Anthropic (73,8%).
El modelo sustituirá a GPT-3.5 Turbo para los abonados a ChatGPT Plus y Teams, ofreciendo a los usuarios un modelo más potente sin coste adicional.
Las primeras en adoptarlo, entre ellas las empresas emergentes Ramp y Superhuman, han obtenido resultados prometedores en tareas como la categorización de recibos y las respuestas personalizadas por correo electrónico.
OpenAI quiere hacer valer la seguridad de GPT-4o mini
Aunque OpenAI está ampliando los límites con las capacidades y la asequibilidad de GPT-4o mini, no escatima en seguridad. Utiliza los mismos mecanismos que desarrolló para el modelo GPT-4o de mayor tamaño.
OpenAI también reunió a más de 70 expertos en campos como la psicología social y la desinformación para poner a prueba a GPT-4o.
Estos especialistas ayudaron a identificar posibles riesgos, lo que permitió al equipo abordar las cuestiones antes de que se convirtieran en problemas. Lo aprendido se incorporó al GPT-4o mini.
OpenAI también ha introducido lo que denominan método de "jerarquía de instrucciones", que "ayuda a mejorar la capacidad del modelo para resistir jailbreaks, inyecciones de instrucciones y extracciones de instrucciones del sistema. Esto hace que las respuestas del modelo sean más fiables y ayuda a que sea más seguro utilizarlo en aplicaciones a escala."
Probablemente sea un argumento para usuarios empresariales que quieren evitar a toda costa resultados erróneos y alucinaciones.
De cara al futuro, OpenAI planea ampliar las capacidades de GPT-4o mini, incluida su capacidad para generar imágenes y salidas de audio y vídeo. También está previsto que el modelo esté disponible a través de Apple Inteligencia este otoño, coincidiendo con el lanzamiento de iOS 18.
Aunque GPT-4o mini es bastante emocionante, OpenAI se ha enfrentado a contratiempos en otras áreas. La empresa retrasó recientemente el lanzamiento de las funciones de voz y lectura de emociones para ChatGPT, alegando la necesidad de realizar pruebas de seguridad adicionales.
La gente se quedó atónita cuando la empresa mostró GPT-4o y su síntesis de vozpero las cosas se han calmado desde entonces.
No obstante, GPT-4o mini demuestra que la gente de OpenAI sigue trabajando duro a pesar de un puñado de polémicas recientes.