OpenAI lance la série "o1", qui repousse les limites du raisonnement de l'IA

12 septembre 2024

  • OpenAI lance deux nouveaux modèles avancés : o1-preview et o1-mini
  • Ils sont capables de raisonner en plusieurs étapes, ce qui est idéal pour les questions complexes.
  • o1-preview s'est déjà avéré supérieur à GPT-4o pour certaines tâches
o1

OpenAI a publié de nouveaux modèles de raisonnement avancés, la série "o1". 

o1 existe actuellement en deux versions - o1-preview et o1-mini - et est conçu pour effectuer des tâches de raisonnement complexes, marquant ce que l'OpenAI décrit comme "un nouveau paradigme" dans le développement de l'IA.

"C'est ce que nous considérons comme le nouveau paradigme dans ces modèles", a expliqué Mira Murati, directrice de la technologie d'OpenAI, dans un communiqué de presse. déclaration à Câblés. "Il est bien meilleur pour s'attaquer à des tâches de raisonnement très complexes.

Contrairement aux itérations précédentes qui excellaient principalement en termes d'échelle, par exemple en lançant des calculs sur un problème, o1 vise à reproduire le processus de pensée humain qui consiste à "raisonner à travers" les problèmes. 

Plutôt que de générer une réponse unique, le modèle travaille étape par étape, en envisageant plusieurs approches et en se révisant si nécessaire, une méthode connue sous le nom de "chaîne de pensée". 

Cela lui permet de résoudre des problèmes complexes en mathématiques, en codage et dans d'autres domaines avec un niveau de précision que les modèles existants, y compris le GPT-4o, peinent à atteindre.

Mark Chen, vice-président de la recherche d'OpenAI, a expliqué le processus d'apprentissage de o1 et en quoi il diffère du raisonnement typique d'un modèle de langage. "Le modèle affine sa réflexion et peaufine les stratégies qu'il utilise pour parvenir à la réponse", a déclaré Mark Chen. 

Il a démontré le modèle à l'aide de plusieurs énigmes mathématiques et de questions de chimie avancée qui avaient auparavant laissé GPT-4o dans l'impasse. 

Une énigme qui a déconcerté les modèles précédents posait la question suivante : "Une princesse est aussi âgée que le prince : "Une princesse est aussi âgée que le prince le sera lorsque la princesse est deux fois plus âgée que le prince ne l'était lorsque l'âge de la princesse était égal à la moitié de la somme de leurs âges actuels. Quel est l'âge du prince et de la princesse ?" 

Le modèle o1 a déterminé la bonne réponse : le prince a 30 ans et la princesse 40 ans.

Comment accéder à o1

Les utilisateurs de ChatGPT Plus peuvent déjà accéder à o1 depuis ChatGPT.

C'est une surprise, car la fonction vocale de GPT-4o est toujours en cours de déploiement des mois après sa démonstration. Peu de gens s'attendaient à ce qu'o1 soit lancé aussi brusquement, sans la préparation habituelle.

o1

o1 semble lié au projet "Strawberry" d'OpenAI, dont le nom de code est "Strawberry". Voici une chose amusante : la plupart des modèles d'IA ne savent pas combien de R il y a dans "fraise". Cela perturbe leurs capacités de raisonnement.

J'ai testé cela dans o1. Et voilà, c'est bon. Il est clair que l'approche de o1 en matière de raisonnement permet de résoudre efficacement ce type de questions.

La récente vague de discussions de Sam Altman sur les réseaux sociaux à propos des fraises pourrait être liée à ce fameux problème d'IA à la fraise et au nom de code d'o1 "Project Strawberry" (projet fraise). Si ce n'est pas le cas, il s'agit d'une étrange coïncidence.

Un changement de cap dans la résolution des problèmes

La capacité du modèle o1 à "raisonner" pour résoudre les problèmes représente un progrès dans le domaine de l'IA, qui pourrait s'avérer tout à fait révolutionnaire si ses performances réelles étaient prouvées "dans la nature".

Les nouveaux modèles ont déjà montré de bonnes performances dans des tests tels que l'American Invitational Mathematics Examination (AIME). 

Selon OpenAI, le nouveau modèle a résolu 83% des problèmes présentés à l'AIME, contre seulement 12% pour GPT-4o.

Si les atouts d'o1 sont évidents, il y a néanmoins des compromis à faire.

Le modèle prend plus de temps pour générer des réponses en raison de ses méthodologies plus réfléchies. L'avenir nous dira dans quelle mesure cela aura un impact sur la facilité d'utilisation générale. 

Les origines étranges de l'O1

o1 fait suite à des discussions autour d'un projet OpenAI sous le nom de code "Strawberry". qui a vu le jour à la fin de l'année 2023.

Selon les premières rumeurs, il s'agirait d'un modèle d'IA capable d'explorer le web de manière autonome, conçu pour mener des "recherches approfondies".

Les discussions autour de Strawberry se sont intensifiées il y a peu lorsque The Information a divulgué des informations sur les projets internes d'OpenAI. OpenAI serait en train de développer deux formes de Strawberry.

  1. La première est une version plus petite et simplifiée destinée à être intégrée dans ChatGPT. Elle vise à améliorer les capacités de raisonnement dans les scénarios où les utilisateurs ont besoin de réponses plus réfléchies et détaillées plutôt que de réponses rapides. On dirait que cela pourrait être o1.
  2. Une autre version, plus grande et plus puissante, est utilisée pour générer des données d'entraînement "synthétiques" de haute qualité pour le prochain modèle linguistique phare d'OpenAI, dont le nom de code est "Orion". Ce modèle peut ou non être lié à o1.

OpenAI n'a pas fourni d'éclaircissement direct sur ce qu'est réellement Strawberry. Cependant, il est largement admis que o1 est Strawberry.

Un complément, pas un remplacement

Murati a souligné que o1 n'est pas conçu pour remplacer GPT-4o mais pour le compléter. 

"Il y a deux paradigmes", a-t-elle déclaré. "Le paradigme du changement d'échelle et ce nouveau paradigme. Nous espérons les réunir". 

Alors que l'OpenAI continue de développer GPT-5, qui sera probablement encore plus grand et plus puissant que GPT-4o, les futurs modèles pourraient incorporer les fonctions de raisonnement de o1. 

Cette fusion pourrait remédier aux limites persistantes des grands modèles de langage (LLM), telles que leur difficulté à résoudre des problèmes apparemment simples nécessitant une déduction logique, par exemple le problème de la fraise ci-dessus. 

Anthropic et Google seraient en train de faire la course pour intégrer des fonctionnalités similaires dans leurs modèles. Le projet AlphaProof de Google, par exemple, associe également des modèles de langage à l'apprentissage par renforcement pour résoudre des problèmes mathématiques difficiles. 

Toutefois, M. Chen estime que l'OpenAI a une longueur d'avance. "Je pense que nous avons fait quelques percées dans ce domaine", a-t-il déclaré, "je pense que cela fait partie de notre avantage. Elle est en fait assez douée pour raisonner dans tous les domaines".

Yoshua Bengio, éminent chercheur en IA et lauréat du prestigieux prix Turing, a salué les progrès accomplis, tout en appelant à la prudence.

 "Si les systèmes d'IA devaient faire preuve d'un véritable raisonnement, cela permettrait d'assurer la cohérence des faits, des arguments et des conclusions de l'IA," a-t-il déclaré au FT.

Sécurité et considérations éthiques

Dans le cadre de son engagement en faveur d'une IA responsable, OpenAI a renforcé les fonctions de sécurité d'o1, y compris les outils de sécurité du contenu "on-by-default". 

Ces outils permettent d'éviter que le modèle ne produise des résultats nuisibles ou dangereux.

"Nous sommes heureux d'annoncer que les boucliers d'invite et les matériaux protégés pour le texte sont désormais disponibles dans Azure OpenAI Service", a déclaré OpenAI dans un communiqué de presse. Article de blog de Microsoft

La série o1 est disponible en accès anticipé dans Azure AI Studio de Microsoft et dans les modèles GitHub, et une diffusion plus large est prévue prochainement. 

OpenAI espère qu'o1 permettra aux développeurs et aux entreprises d'innover de manière plus rentable, conformément à sa mission plus large qui consiste à rendre l'IA plus accessible aux utilisateurs professionnels. 

"Nous pensons que cela nous permettra d'expédier l'intelligence à moindre coût", conclut M. Chen. "Et je pense que c'est vraiment la mission principale de notre entreprise.

Dans l'ensemble, il s'agit d'une version passionnante. Il sera très intéressant de voir sur quelles questions, quels problèmes et quelles tâches o1 s'appuiera.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation