Alibaba lanza LLM de código abierto para enfrentarse a Llama 2 de Meta

7 de agosto de 2023

Alibaba ha lanzado en su plataforma de computación en nube dos grandes modelos lingüísticos de código abierto que se espera compitan con la versión más pequeña del modelo Llama 2 de Meta.

La empresa tecnológica china lanzó su modelo Tongyi Qiawen a principios de año y afirma que las nuevas versiones, Qwen-7B y Qwen-7B-Chat, son versiones reducidas de ese LLM. El "7B" en los nombres de los modelos se refiere a que han sido entrenados con 7.000 millones de parámetros, la misma cantidad con la que se entrenó la versión más pequeña de Llama 2 de Meta.

Disponer de modelos preentrenados supone un enorme ahorro de tiempo y gastos informáticos para las empresas que desean utilizar modelos de IA en sus aplicaciones.

Alibaba ha adoptado un enfoque similar para Meta lanza Llama 2 haciendo que sus modelos más pequeños sean de código abierto y de libre aplicación por terceros desarrolladores. La empresa espera que esto se traduzca en una mayor adopción y prueba de sus modelos en el mundo real.

Al igual que Meta, Alibaba se refiere a los modelos como de "código abierto", aunque eso no es del todo cierto. Los requisitos de uso son similares a los de Llama 2, y las empresas que tienen 100 millones de usuarios al mes necesitan una licencia de Alibaba.

Aunque los modelos son gratuitos para la mayoría de los usuarios, Alibaba se beneficiará económicamente cobrando a los usuarios de su plataforma de computación en nube por utilizarlos. Por el momento, no tiene previsto lanzar su modelo de mayor tamaño de forma gratuita o en código abierto. Alibaba también fabrica Llama 2 disponible en sus servidores, por lo que será interesante ver cómo se desarrolla la adopción de estos modelos competidores.

La noticia llega dos semanas después de que Alibaba anunciara mejoras en su plataforma de computación en nube.

Actualizó su vectorial en su servicio de almacenamiento de datos AnalyticDB que, según la empresa, agilizará la creación de aplicaciones de IA generativa. Afirma que se pueden crear aplicaciones de IA preconfiguradas en tan solo 30 minutos.

El movimiento de Alibaba es indicativo de la intensificación de la carrera por la inteligencia artificial entre China y Estados Unidos. Otros gigantes tecnológicos chinos, Huawei y Tencent, también han estado trabajando en sus propios modelos y se espera que pronto hagan anuncios al respecto.

A pesar del insaciable apetito por las aplicaciones de IA, las restricciones a la exportación de chips de EE.UU. y escasez mundial de GPU de gama alta están ralentizando un poco el ritmo de desarrollo de la IA china.

En Normativa china sobre IA que entrarán en vigor la semana que viene también ralentizarán el ritmo de los desarrolladores de IA generativa mientras se abren paso en el proceso burocrático de obtención de licencias de IA por parte de las autoridades.

Las empresas tecnológicas chinas como Alibaba esperan poder superar algunos de estos retos y lograr una mayor adopción fuera de su mercado nacional. Eso puede ser bastante más fácil que para los desarrolladores de modelos de pago como OpenAI y Google encontrar tracción en China.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Eugene van der Watt

Eugene es ingeniero electrónico y le encanta todo lo relacionado con la tecnología. Cuando descansa de consumir noticias sobre IA, lo encontrará jugando al billar.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales