Meta ha anunciado el lanzamiento de Code Llama, su nueva herramienta de IA para codificación.
Code Llama es una versión perfeccionada del LLM Llama 2 de Meta, que ha sido entrenado para escribir y documentar código. La nueva herramienta toma descripciones en lenguaje natural y las convierte en código. También puede depurar, explicar y documentar código suministrado como entrada.
Es una gran herramienta si estás aprendiendo a programar, pero son los ingenieros de software los que más se beneficiarán de Code Llama.
La herramienta es compatible con la mayoría de los lenguajes de programación más populares, como Python, C++, Java, PHP, Typescript (Javascript), C#, Bash y otros.
Con Code Llama puedes pedirle "Escribe una función en Python para calcular los 100 primeros números primos", y te generará el código.
Herramientas como ChatGPT ya permiten escribir código, pero Code Llama tiene una serie de características que posiblemente la conviertan en una mejor herramienta de codificación.
ChatGPT tiene una ventana de contexto de entre 4.000 y 8.000 tokens, mientras que Code Llama puede manejar hasta 100.000 tokens de contexto. El primer beneficio obvio de tener una ventana de contexto más grande es que puede escribir código sustancialmente más largo.
La perspectiva más excitante es poder introducir un gran trozo de código y que Code Llama lo depure por ti. Si quisieras usar ChatGPT para hacer eso, tendrías que depurar pequeños trozos cada vez.
Hoy lanzamos Code Llama, un gran modelo de lenguaje construido sobre Llama 2, perfeccionado para la codificación y el estado del arte de las herramientas de codificación disponibles públicamente.
De acuerdo con nuestro enfoque abierto, Code Llama ya está disponible públicamente tanto para investigación como para uso comercial.
Más ⬇️
- Meta AI (@MetaAI) 24 de agosto de 2023
Meta ha lanzado 3 tamaños de Code Llama con parámetros de 7B, 13B y 34B respectivamente. Los modelos más pequeños funcionan más rápido, con menos potencia de procesamiento necesaria, pero son menos potentes que el modelo 34B.
Los dos modelos más pequeños también han sido entrenados con la capacidad de relleno en el medio (FIM). Esto permite que un programador introduzca el código existente y que Code Llama se encargue de completarlo.
Además de los modelos básicos compatibles con varios lenguajes, Meta ha lanzado dos versiones entrenadas específicamente en Python e Instruct.
¿Es bueno Code Llama?
Meta realizó sus propias pruebas comparativas y descubrió que Code Llama "funcionaba mejor que los LLM de código abierto y específicos de código y superaba a Llama 2".
Aquí está la tabla de referencia que muestra cómo Code Llama se compara con otros modelos.
Fuente: Meta
GPT-4 sigue estando por delante a cierta distancia, pero es un modelo enorme y no es gratuito. Code Llama es gratuito y la versión 7B podría ejecutarse en tu máquina local.
El uso de GPT-4 requiere que su código se envíe a través de los servidores de OpenAI y para muchas empresas eso representa un enorme riesgo para su propiedad intelectual.
Como Code Llama se ejecuta en servidores locales, no hay riesgo de que se filtren datos privados de la empresa o se utilicen para entrenar otros modelos.
Además de los modelos liberados, el Documento de investigación sobre el Código Llama hace referencia a un modelo llamado "Unnatural Code Llama". Obtuvo una puntuación de 62,2% en la prueba comparativa HumanEval, que se acerca mucho a los 67% de GPT-4.
Aún no se sabe cuándo saldrá a la venta este modelo, pero ese tipo de rendimiento supera con creces al PaLM Coder de Google e incluso hará que el GPT-4 sea difícil de vender.