¿Por qué el mundo de la inteligencia artificial despotrica de las fresas?

28 de agosto de 2024

  • OpenAI estaría trabajando en un proyecto secreto con nombre en clave "Strawberry"
  • Podría estar relacionado con el proyecto Q*, del que se habló por primera vez en noviembre de 2023
  • Se sabe poco de Strawberry, aunque podría formar parte de GPT-5.

OpenAI ha vuelto a quedarse en silencio, y las tan anunciadas funciones de chat de voz de GPT-4o se han desplegado mucho más despacio de lo que se esperaba. 

Pero se han oído rumores sobre nuevos proyectos, entre ellos BúsquedaGPTque combina IA generativa y navegación web, y el más misterioso "Proyecto Strawberry".

Los orígenes de Strawberry se remontan a noviembre de 2023, cuando un modelo (más bien una técnica de entrenamiento) llamado Q* apareció en filtraciones de Reuters.

Incluso se especuló con que Q* era potencialmente peligrosa y desempeñó algún papel en la contratación y despido del CEO Sam Altman el año pasado. 

Se pensaba que Q* combinaba un modelo de razonamiento avanzado con un agente de IA capaz de explorar Internet.

A pesar de los dramáticos titulares: "OpenAI se asienta sobre un modelo apocalípticamente poderoso", su legitimidad fue muy discutida en su momento. 

En mayo y junio de este año se conocieron más detalles del proyecto Q*, que pasó a llamarse Proyecto Strawberry o simplemente Strawberry. Según Reuters, Strawberry implica un método especializado de entrenamiento de modelos de IA para explorar Internet de forma autónoma y llevar a cabo una "investigación profunda".

La Q se refiere probablemente al aprendizaje Q, una técnica de aprendizaje por refuerzo (RL) establecida desde hace tiempo. En cuanto a la estrella (*), hay más incertidumbre. Reuters dice que es similar a un método desarrollado en Stanford llamado "Self-Taught Reasoner" o "STaR". Otros dicen que está relacionado con un algoritmo de búsqueda llamado A*.

Las fuentes mencionaron que OpenAI quiere que el modelo investigue navegando de forma autónoma por la web, asistido por un "agente informático" (CUA), que también es un componente clave de SearchGPT.

Según esas fuentes, OpenAI quiere que Strawberry realice "tareas de horizonte largo" (LHT), que implican una planificación y ejecución complejas durante periodos prolongados. 

El profesor de Stanford Noah Goodman, uno de los creadores de STaR, habló a Reuters sobre la tecnología, "Creo que eso es a la vez emocionante y aterrador... si las cosas siguen en esa dirección tenemos algunas cosas serias en las que pensar como humanos".

Preguntado por Strawberry, un portavoz de OpenAI hizo una declaración general sobre los objetivos de desarrollo de IA de la empresa:

"Queremos que nuestros modelos de IA vean y entiendan el mundo más como nosotros. La investigación continua de nuevas capacidades de IA es una práctica habitual en el sector, con la creencia compartida de que estos sistemas mejorarán su razonamiento con el tiempo."

Las redes sociales agitan la olla

Poco después del informe de Reuters, a principios de agosto, Altman publicó una foto de fresas acompañada de la leyenda "me encanta el verano en el jardín", reavivando las especulaciones sobre el proyecto Strawberry.

Entonces, el usuario iruletheworldmo, una especie de cuenta meme/sátira centrada en la IA (con una foto de perfil de Theodore Twombly, interpretado por Joaquin Phoenix, en la película Her, de temática sobre IA, que se ha asociado con Altman), empezó a publicar contenido relacionado con las fresas, insinuando un posible avance de "nivel dos" en la IA.

El usuario publicó: "bienvenido al nivel dos. ¿cómo te sientes? ¿te he hecho sentir?". Altman, consejero delegado de OpenAI, respondió con un "increíble tbh".

Este intercambio desencadenó una reacción en cadena de publicaciones sobre la fresa y especulaciones masivas en X y Reddit. 

La fresa da otra vuelta de tuerca

Hace poco, La información revelada que OpenAI se está preparando para lanzar una versión de Strawberry como parte de un chatbot y posiblemente integrarlo en ChatGPT este mismo otoño. 

OpenAI también habría demostrado las capacidades de Strawberry a funcionarios de seguridad nacional estadounidenses.

Curiosamente, según The Information, OpenAI está desarrollando dos versiones distintas de Strawberry:

  1. Esta versión reducida y simplificada está pensada para su integración en aplicaciones de chat como ChatGPT. Su objetivo es mejorar la capacidad de razonamiento en situaciones en las que los usuarios necesitan respuestas más reflexivas y detalladas que respuestas rápidas.
  2. Esta versión más grande y potente se utiliza para generar datos de entrenamiento "sintéticos" de alta calidad para el próximo modelo lingüístico insignia de OpenAI, cuyo nombre en clave es "Orion".

Los datos sintéticos generados por Strawberry podrían reducir la dependencia de textos e imágenes de Internet para el entrenamiento.

Esto podría dar lugar a modelos de IA más precisos y fiables, y resolver problemas persistentes como las "alucinaciones" de la IA o las colapso del modelo

Extrañamente, sin embargo, estas caracterizaciones de Strawberry no coinciden tanto con las descripciones anteriores de Q*.

Quizá podríamos especular con que Strawberry, el agente autónomo, navega por la web de forma autónoma y utiliza su "investigación profunda" para, en última instancia, sintetizar los datos.

¿Quizá esto sea más eficiente desde el punto de vista informático y más útil para el entrenamiento de modelos que el simple raspado de los datos en bruto?

AI no sabe cuántas R hay en fresa

Aquí es donde la historia da un giro extraño e irónico. 

Strawberry podría llamarse así por una palabra que los modelos de IA actuales, incluidos algunos de los más avanzados, suelen tener problemas para deletrear correctamente. 

Pregúntale a una IA cuántas "r" hay en "fresa" y es posible que responda con seguridad "dos" en lugar de las "tres" correctas.

Suena ridículo, ¿verdad? Ni yo mismo me lo creía hasta que lo probé con Claude. 

Fresa

Cuando esto salió a la luz por primera vez, algunos alegaron que se trataba de algún tipo de "huevo de pascua" o broma dentro de los sistemas de OpenAI.

Pero viendo que Claude reacciona igual que ChatGPT, a menos que las empresas de IA estén confabulando bromas sobre nichos de fresas entre bastidores, parece poco probable. 

La explicación es elegante por su sencillez.

Los modelos lingüísticos, a pesar de su nombre, son sistemas basados en las matemáticas. No entienden "de verdad" las palabras. El texto se traduce a código, con lo que se corre el riesgo de perder el contexto y el significado a nivel de palabra.

La cuestión más desconcertante es por qué la fresa desencadena con fiabilidad este defecto. 

En cualquier caso, no está claro si OpenAI eligió el nombre "Strawberry" (fresa) como un guiño juguetón a este escollo habitual de la IA o por pura coincidencia. Parece algo que podría hacer Altman, tanto si Strawberry es real como si no. 

Lo que sigue en esta extraña pero interesante (...) historia de la fresa no lo sabe nadie. Para ser honesto, tengo la sensación, en esta etapa, de que ninguna de las "pruebas" especulativas que tenemos de los principales medios de comunicación es totalmente representativa de lo que está pasando en OpenAI.

Tendremos que esperar a SearchGPT y/o GPT-5 para ver hasta qué punto evolucionan los productos de OpenAI a partir de Strawberry y sus otros proyectos.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales