Meta a dévoilé un nouvel outil d'intelligence artificielle, CodeCompose, conçu pour refléter les capacités de Copilot de GitHub.
L'outil a été dévoilé lors d'un événement mettant en avant la stratégie d'IA en cours de Meta, qui a également abordé la question des puces personnalisées pour l'entraînement des modèles d'IA.
CodeCompose n'est pas encore accessible au public, mais Meta a révélé que ses équipes de développement internes utilisaient déjà l'outil.
Meta a également a publié un article décrivant CodeCompose : "CodeCompose est basé sur le LLM InCoder qui fusionne les capacités génératives avec la bidirectionnalité. Nous avons mis CodeCompose à l'échelle pour servir des dizaines de milliers de développeurs à Meta, dans plus de 10 langages de programmation et plusieurs surfaces de codage."
CodeCompose est notamment formé, testé et validé sur la base de données de code de Meta.
Cela inclut les cadres et les bibliothèques développés dans Hack, le langage de programmation de Meta, en veillant à ce que l'outil d'IA intègre ces composants dans ses recommandations de codage.
Comme le décrit Michael Bolin, ingénieur logiciel chez Meta, "la base du modèle repose sur la recherche publique de Meta. Nous l'avons affiné spécifiquement pour répondre à nos besoins internes uniques et à nos bases de données de codage".
CodeCompose revendique 6,7 milliards de paramètres, soit la moitié de ce que propose Copilot, un outil similaire que GitHub propose en collaboration avec OpenAI. Toutefois, un plus grand nombre de paramètres n'est pas toujours synonyme d'amélioration des performances. Selon Meta, ses données d'entraînement de base sont méticuleusement nettoyées, ce qui réduit considérablement la probabilité que le modèle suggère un code erroné.
Étant donné que CodeCompose est formé sur le code interne, échappera-t-il à l'application de la loi sur la protection de l'environnement ? poursuites en cours contre l'utilisation potentiellement illicite du code des utilisateurs par OpenAI ?
Jusqu'à présent, la position de Meta sur la question de savoir si CodeCompose a ingéré du code sous licence ou sous copyright reste nébuleuse.
Cependant, ils ont admis que "la formation d'InCoder consistait à collecter du code public avec des licences spécifiques sur des plateformes telles que GitHub et GitLab, ainsi que sur StackOverflow".
Meta continue de contrarier les autres entreprises d'IA en proposant des modèles open-source qui permettent aux particuliers et aux entreprises de construire leurs modèles sans frais. La monétisation de l'IA s'avère déjà assez délicate, et la publication de chaque modèle open-source réduit les profits potentiels.