Meta ha presentato un nuovo strumento di intelligenza artificiale, CodeCompose, progettato per rispecchiare le capacità di Copilot di GitHub.
Lo strumento è stato svelato nel corso di un evento che ha messo in luce la strategia di Meta in materia di IA, in cui si è parlato anche di chip personalizzati per l'addestramento dei modelli di IA.
CodeCompose non è attualmente accessibile al pubblico, ma Meta ha rivelato che i suoi team di sviluppo interni utilizzano già questo strumento.
Meta ha anche ha pubblicato un documento che descrive CodeCompose: "CodeCompose si basa sul LLM di InCoder che fonde le capacità generative con la bidirezionalità. Abbiamo scalato CodeCompose fino a servire decine di migliaia di sviluppatori a Meta, attraverso più di 10 linguaggi di programmazione e diverse superfici di codifica".
In particolare, CodeCompose viene addestrato, testato e convalidato sul database di codice di Meta.
Questo include framework e librerie sviluppate in Hack, il linguaggio di programmazione di Meta, assicurando che lo strumento di intelligenza artificiale integri questi componenti nelle sue raccomandazioni di codifica.
Come ha descritto Michael Bolin, ingegnere software di Meta, "le basi del modello si fondano sulla ricerca pubblica di Meta. Lo abbiamo perfezionato in modo specifico per soddisfare le nostre esigenze interne e i nostri database di codifica".
CodeCompose vanta 6,7 miliardi di parametri, la metà di quelli offerti da Copilot, uno strumento simile che GitHub offre in collaborazione con OpenAI. Tuttavia, un numero maggiore di parametri non garantisce sempre un aumento delle prestazioni. Secondo Meta, i suoi dati di addestramento fondamentali vengono puliti meticolosamente, riducendo notevolmente la probabilità che il modello suggerisca codice errato.
Poiché CodeCompose viene addestrato sul codice interno, può eludere il cause legali attualmente in corso contro l'uso potenzialmente illecito del codice degli utenti da parte di OpenAI?
Finora, la posizione di Meta sul fatto che CodeCompose abbia ingerito codice con licenza o copyright rimane nebulosa.
Tuttavia, hanno ammesso che "la formazione di InCoder prevedeva la raccolta di codice pubblico con licenze specifiche da piattaforme come GitHub e GitLab e anche da StackOverflow".
Meta continua a inimicarsi le altre aziende di IA offrendo modelli open-source che consentono a privati e aziende di costruire i loro modelli senza costi. La monetizzazione dell'IA si sta già rivelando abbastanza complicata, e il rilascio di ogni modello open-source riduce i potenziali profitti.