Pourquoi le monde de l'IA s'acharne-t-il sur les fraises ?

28 août 2024

  • OpenAI travaillerait sur un projet secret dont le nom de code est "Strawberry" (fraise)
  • Il pourrait être lié au projet Q*, dont il a été question pour la première fois en novembre 2023.
  • On sait peu de choses sur Strawberry, mais il pourrait faire partie de GPT-5.

L'OpenAI s'est à nouveau fait discrète, les fonctionnalités de chat vocal de GPT-4o, tant annoncées, se déployant bien plus lentement que prévu. 

Mais il y a eu des murmures concernant de nouveaux projets en cours de réalisation, notamment RechercheGPTqui combine l'IA générative et la navigation sur le web, et le plus mystérieux "Project Strawberry".

Les origines de Strawberry remontent à novembre 2023, lorsqu'un modèle (ou plutôt une technique d'entraînement) nommé Q* a fait surface dans la base de données du fuites de Reuters.

On a même supposé que Q* était potentiellement dangereux et qu'il avait joué un rôle dans l'embauche et le licenciement du PDG Sam Altman l'année dernière. 

Q* était censé combiner un modèle de raisonnement avancé avec un agent d'intelligence artificielle capable d'explorer l'internet.

Malgré des titres spectaculaires, "OpenAI est assis sur un modèle d'une puissance apocalyptique", sa légitimité était très contestée à l'époque. 

De nouveaux détails sur le projet Q* sont apparus en mai et en juin de cette année, et le projet a été rebaptisé "projet Strawberry" ou simplement "Strawberry". Selon ReutersStrawberry est une méthode spécialisée de formation de modèles d'intelligence artificielle permettant d'explorer l'internet de manière autonome et de mener des "recherches approfondies".

Le Q fait probablement référence à l'apprentissage Q, une technique d'apprentissage par renforcement (RL) établie de longue date. Quant à l'étoile (*), l'incertitude est plus grande. Selon Reuters, il s'agit d'une méthode similaire à celle développée à Stanford, appelée "Self-Taught Reasoner" ou "STaR" (raisonneur autodidacte). D'autres affirment qu'il s'agit d'un algorithme de recherche appelé A*.

Selon certaines sources, OpenAI souhaite que le modèle mène des recherches en naviguant de manière autonome sur le web, avec l'aide d'un "agent d'utilisation de l'ordinateur" (AUE), qui est également un élément clé de la SearchGPT.

Selon ces sources, OpenAI souhaite que Strawberry exécute des "tâches à long terme" (LHT), qui impliquent une planification et une exécution complexes sur de longues périodes. 

Noah Goodman, professeur à Stanford et l'un des créateurs de STaR, a parlé de cette technologie à Reuters, "Je pense que c'est à la fois excitant et terrifiant... si les choses continuent à aller dans cette direction, nous devrons réfléchir sérieusement en tant qu'êtres humains".

Interrogé sur Strawberry, un porte-parole d'OpenAI a fait une déclaration générale sur les objectifs de l'entreprise en matière de développement de l'IA :

"Nous voulons que nos modèles d'IA voient et comprennent le monde davantage comme nous le faisons. La recherche continue de nouvelles capacités d'IA est une pratique courante dans l'industrie, avec la conviction partagée que ces systèmes amélioreront leur raisonnement au fil du temps."

Les médias sociaux font bouger les choses

Peu de temps après le rapport de Reuters, au début du mois d'août, M. Altman a posté une photo de fraises accompagnée de la légende "J'aime l'été dans le jardin", relançant ainsi les spéculations sur le projet Strawberry.

Ensuite, l'utilisateur iruletheworldmo, une sorte de compte mème/satire axé sur l'IA (avec une photo de profil de Theodore Twombly, joué par Joaquin Phoenix, dans le film Her sur l'IA, qui est devenu associé à Altman), a commencé à publier du contenu sur les fraises, laissant entrevoir une percée potentielle de "niveau 2" dans l'IA.

L'utilisateur a posté : "Bienvenue au niveau 2. Comment vous sentez-vous ? Est-ce que je vous ai fait sentir ?" M. Altman, PDG d'OpenAI, a répondu "incroyable".

Cet échange a déclenché une réaction en chaîne de messages sur le thème de la fraise et une spéculation massive sur X et Reddit. 

La fraise prend un nouveau tournant

Tout récemment, L'information révélée qu'OpenAI se prépare à lancer une version de Strawberry dans le cadre d'un chatbot et à l'intégrer éventuellement à ChatGPT dès cet automne. 

OpenAI aurait également démontré les capacités de Strawberry à des responsables de la sécurité nationale américaine.

Il est intéressant de noter que, selon The Information, OpenAI développe deux versions distinctes de Strawberry :

  1. Cette version réduite et simplifiée est destinée à être intégrée dans des applications basées sur le chat comme ChatGPT. Elle vise à améliorer les capacités de raisonnement dans les scénarios où les utilisateurs ont besoin de réponses plus réfléchies et détaillées plutôt que de réponses rapides.
  2. Cette version plus grande et plus puissante est utilisée pour générer des données d'entraînement "synthétiques" de haute qualité pour le prochain modèle linguistique phare de l'OpenAI, dont le nom de code est "Orion".

Les données synthétiques générées par Strawberry pourraient réduire la dépendance à l'égard des textes et des images récupérés sur l'internet pour la formation.

Cela pourrait potentiellement conduire à des modèles d'IA plus précis et plus fiables, et résoudre des problèmes persistants tels que les "hallucinations" de l'IA ou l'utilisation d'une technologie de l'information pour la gestion de l'information. effondrement du modèle

Curieusement, ces caractérisations de Strawberry ne correspondent pas vraiment aux descriptions précédentes de Q*.

Nous pourrions peut-être supposer que Strawberry, l'agent autonome, navigue sur le web de manière autonome et utilise ses "recherches approfondies" pour synthétiser les données.

Peut-être est-ce plus efficace sur le plan informatique et plus utile pour l'apprentissage des modèles que de simplement récupérer les données brutes elles-mêmes ?

L'IA ne sait pas combien de R il y a dans fraise

C'est ici que l'histoire prend une tournure bizarre et ironique. 

Strawberry pourrait être nommé d'après un mot que les modèles d'IA actuels, y compris certains des plus avancés, ont souvent du mal à orthographier correctement. 

Demandez à une IA combien de "r" il y a dans "fraise", et il y a de fortes chances qu'elle réponde en toute confiance "deux" au lieu de "trois".

Ça a l'air ridicule, non ? Je n'y croyais pas moi-même jusqu'à ce que je l'essaie avec Claude. 

Fraise

Lorsque l'affaire a été révélée, certains ont prétendu qu'il s'agissait d'une sorte d'"œuf de Pâques" ou d'une plaisanterie au sein des systèmes d'OpenAI.

Mais comme Claude réagit de la même manière que ChatGPT, à moins que les sociétés d'IA ne s'entendent en coulisses sur des blagues de niche sur les fraises, cela semble peu probable. 

L'explication est d'une simplicité élégante.

Les modèles linguistiques, malgré leur nom, sont des systèmes basés sur les mathématiques. Ils ne comprennent pas "vraiment" les mots. Le texte est traduit en code, ce qui risque d'entraîner une perte de contexte et de sens au niveau des mots.

La question la plus mystérieuse est de savoir pourquoi la fraise déclenche ce défaut de manière fiable. 

Quoi qu'il en soit, on ne sait pas si OpenAI a choisi le nom "Strawberry" pour faire un clin d'œil à cette pierre d'achoppement de l'IA ou si c'est une pure coïncidence. Cela ressemble à quelque chose qu'Altman pourrait faire, que Strawberry soit réel ou non. 

La suite de cette étrange mais très intéressante (...) histoire de fraises n'a rien d'étonnant. Pour être honnête, j'ai l'impression, à ce stade, qu'aucune des " preuves " spéculatives que nous recevons des principaux organes de presse n'est totalement représentative de ce qui se passe à l'OpenAI.

Nous devrons attendre SearchGPT et/ou GPT-5 pour voir à quel point les produits d'OpenAI évoluent grâce à Strawberry et à leurs autres projets.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation