OpenAI estrena la serie "o1", que amplía los límites del razonamiento artificial

12 de septiembre de 2024

  • OpenAI lanza dos nuevos modelos avanzados: o1-preview y o1-mini
  • Son capaces de realizar razonamientos avanzados de varios pasos, ideales para preguntas complejas
  • o1-preview ya ha demostrado ser superior a GPT-4o en determinadas tareas
o1

OpenAI ha lanzado nuevos modelos de razonamiento avanzado denominados serie "o1". 

Actualmente, o1 se presenta en dos versiones -o1-preview y o1-mini- y está diseñado para realizar tareas de razonamiento complejas, marcando lo que OpenAI describe como "un nuevo paradigma" en el desarrollo de la IA.

"Esto es lo que consideramos el nuevo paradigma en estos modelos", explicó Mira Murati, Directora de Tecnología de OpenAI, en un declaración a Cableado. "Es mucho mejor a la hora de abordar tareas de razonamiento muy complejas".

A diferencia de las iteraciones anteriores, que destacaban principalmente por su escala, por ejemplo, lanzando cálculos a un problema, o1 pretende replicar el proceso de pensamiento humano de "razonar a través" de los problemas. 

En lugar de generar una respuesta única, el modelo trabaja paso a paso, considerando múltiples enfoques y revisándose a sí mismo cuando es necesario, un método conocido como "cadena de pensamiento". 

Esto le permite resolver problemas complejos de matemáticas, codificación y otros campos con un nivel de precisión que los modelos existentes, incluido el GPT-4o, se esfuerzan por alcanzar.

Mark Chen, Vicepresidente de Investigación de OpenAI, explicó el proceso de aprendizaje de o1 y en qué se diferencia del razonamiento típico de los modelos lingüísticos. "El modelo agudiza su pensamiento y afina las estrategias que utiliza para llegar a la respuesta", explica Chen. 

Demostró el modelo con varios enigmas matemáticos y preguntas de química avanzada que antes dejaban perplejo al GPT-4o. 

Un enigma que desconcertaba a los modelos anteriores preguntaba: "Una princesa tiene la edad que tendrá el príncipe cuando la princesa tenga el doble de la edad que tenía el príncipe cuando la edad de la princesa era la mitad de la suma de sus edades actuales. ¿Cuál es la edad del príncipe y de la princesa?". 

El modelo o1 determinó la respuesta correcta: el príncipe tiene 30 años y la princesa, 40.

Cómo acceder a o1

Los usuarios de ChatGPT Plus ya pueden acceder a o1 desde dentro de ChatGPT.

Es una sorpresa, ya que la función de voz de GPT-4o aún se está desplegando meses después de su demo. Pocos esperaban que o1 se lanzara de forma tan abrupta, saltándose la preparación habitual.

o1

o1 parece estar relacionado con el proyecto "Fresa" de OpenAI. Es curioso: la mayoría de los modelos de IA no saben cuántas erres hay en "fresa". Es un problema para su capacidad de razonamiento.

He probado esto en o1. Y he aquí que acertó. Está claro que el enfoque de razonamiento de o1 ayuda a resolver este tipo de preguntas con eficacia.

La reciente racha de Sam Altman hablando de fresas en las redes sociales podría estar relacionada con este famoso problema de IA con sabor a fresa y el nombre en clave de o1 "Proyecto Fresa". Si no, es una extraña coincidencia.

Un paso adelante en la resolución de problemas

La capacidad del modelo o1 de "razonar" para resolver problemas representa un avance en la inteligencia artificial, algo que podría ser revolucionario si su rendimiento en el mundo real se demuestra "in the wild".

Los nuevos modelos ya han demostrado un gran rendimiento en pruebas como el American Invitational Mathematics Examination (AIME). 

Según OpenAI, el nuevo modelo resolvió 83% de los problemas presentados en el AIME, frente a sólo 12% de GPT-4o.

Aunque los puntos fuertes de o1 son evidentes, tiene sus contrapartidas.

El modelo tarda más en generar respuestas debido a sus metodologías más reflexivas. El tiempo dirá en qué medida afecta esto a la usabilidad general. 

los extraños orígenes de o1

o1 sale al paso de las conversaciones en torno a un proyecto de OpenAI nombre en clave "Fresa". que surgió a finales de 2023.

Inicialmente se rumoreó que se trataba de un modelo de IA capaz de explorar la web de forma autónoma, diseñado para realizar "investigación profunda".

Las conversaciones en torno a Strawberry se intensificaron no hace mucho cuando The Information filtró información sobre los proyectos internos de OpenAI. En concreto, OpenAI está supuestamente desarrollando dos formas de Strawberry.

  1. Una es una versión más pequeña y simplificada destinada a integrarse en ChatGPT. Su objetivo es mejorar la capacidad de razonamiento en situaciones en las que los usuarios necesitan respuestas más reflexivas y detalladas que respuestas rápidas. Esto parece que podría ser o1.
  2. Otra es una versión más grande y potente que se utiliza para generar datos de entrenamiento "sintéticos" de alta calidad para el próximo modelo lingüístico insignia de OpenAI, cuyo nombre en clave es "Orion". Esto puede o no estar relacionado con o1.

OpenAI no ha aclarado directamente qué es realmente Strawberry. Sin embargo, se da por hecho que o1 es Strawberry.

Complemento, no sustituto

Murati subrayó que o1 no está diseñado para sustituir a GPT-4o, sino para complementarlo. 

"Hay dos paradigmas", dijo. "El paradigma de la escala y este nuevo paradigma. Esperamos unirlos". 

Mientras OpenAI sigue desarrollando GPT-5, que probablemente será aún mayor y más potente que GPT-4o, los futuros modelos podrían incorporar las funciones de razonamiento de o1. 

Esta fusión podría abordar las limitaciones persistentes de los grandes modelos lingüísticos (LLM), como su lucha con problemas aparentemente sencillos que requieren deducción lógica, por ejemplo, el problema de la fresa anterior. 

Al parecer, Anthropic y Google están compitiendo por integrar funciones similares en sus modelos. El proyecto AlphaProof de Google, por ejemplo, también combina modelos lingüísticos con aprendizaje por refuerzo para abordar problemas matemáticos difíciles. 

Sin embargo, Chen cree que OpenAI tiene ventaja. "Creo que hemos hecho algunos avances en este campo", afirma, "creo que es parte de nuestra ventaja. En realidad es bastante bueno razonando en todos los dominios".

Yoshua Bengio, uno de los principales investigadores de IA y galardonado con el prestigioso premio Turing, alabó los avances, pero pidió cautela.

 "Si los sistemas de IA demostraran un razonamiento genuino, permitiría la coherencia de los hechos, argumentos y conclusiones realizados por la IA". declaró al FT.

Seguridad y consideraciones éticas

Como parte de su compromiso con la IA responsable, OpenAI ha reforzado las funciones de seguridad de o1, incluidas las herramientas de seguridad de contenidos "activadas por defecto". 

Estas herramientas ayudan a evitar que el modelo produzca resultados perjudiciales o inseguros.

"Nos complace anunciar que Prompt Shields y Protected Materials for Text ya están disponibles de forma general en Azure OpenAI Service", declaró OpenAI en un Publicación en el blog de Microsoft

La serie o1 está disponible en acceso anticipado en Azure AI Studio y GitHub Models de Microsoft, y se prevé un lanzamiento más amplio en breve. 

OpenAI espera que o1 permita a desarrolladores y empresas innovar de forma más rentable, en línea con su misión más amplia de hacer la IA más accesible a los usuarios corporativos. 

"Creemos que nos permitirá enviar inteligencia más barata", concluyó Chen. "Y creo que esa es realmente la misión principal de nuestra empresa".

En definitiva, un lanzamiento emocionante. Será muy interesante ver en qué cuestiones, problemas y tareas prospera o1.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales