A Alibaba lança um LLM de código aberto para fazer frente ao Llama 2 da Meta

7 de agosto de 2023

A Alibaba lançou dois modelos de língua de grande dimensão de código aberto na sua plataforma de computação em nuvem, que deverão competir com a versão mais pequena do modelo Llama 2 da Meta.

A empresa chinesa de tecnologia lançou o seu modelo Tongyi Qiawen no início deste ano e afirma que os novos lançamentos, Qwen-7B e Qwen-7B-Chat, são versões reduzidas desse LLM. O "7B" nos nomes dos modelos refere-se ao facto de terem sido treinados com 7 mil milhões de parâmetros, o que é a mesma quantidade com que foi treinada a versão mais pequena do Llama 2 da Meta.

A disponibilidade de modelos pré-treinados representa uma enorme poupança de tempo e de despesas de computação para as empresas que pretendem utilizar modelos de IA nas suas aplicações.

A Alibaba adoptou uma abordagem semelhante para Lançamento do Llama 2 pela Meta tornando os seus modelos mais pequenos de código aberto e livres para serem implementados por programadores terceiros. A empresa espera que isto resulte numa maior adoção e em testes reais dos seus modelos.

Tal como o Meta, o Alibaba refere-se aos modelos como sendo de "código aberto", embora isso não seja bem verdade. Tem requisitos de utilização semelhantes aos do Llama 2, com as empresas que têm 100 milhões de utilizadores por mês a necessitarem de uma licença da Alibaba.

Embora os modelos estejam disponíveis gratuitamente para a maioria dos utilizadores, a Alibaba beneficiará financeiramente ao cobrar aos utilizadores da sua plataforma de computação em nuvem para os executar. Ainda não tem planos para lançar o seu modelo maior gratuitamente ou em código aberto. A Alibaba também fabrica o Llama 2 disponíveis nos seus servidores, pelo que será interessante ver como se processa a adoção destes modelos concorrentes.

A notícia do lançamento surge cerca de duas semanas depois de a Alibaba ter anunciado actualizações para a sua plataforma de computação em nuvem.

Actualizou os seus no seu serviço de armazenamento de dados AnalyticDB que, segundo a empresa, tornará a criação de aplicações de IA generativas muito mais rápida. A empresa afirma que as aplicações de IA pré-configuradas podem ser criadas em apenas 30 minutos.

A iniciativa da Alibaba é indicativa da intensificação da corrida à IA entre a China e os EUA. Outros gigantes tecnológicos chineses, como a Huawei e a Tencent, também têm estado a trabalhar nos seus próprios modelos, prevendo-se para breve anúncios sobre estas frentes.

Apesar do apetite insaciável por aplicações de IA, as restrições à exportação de chips dos EUA e escassez mundial de GPU topo de gama estão a abrandar um pouco o ritmo de desenvolvimento da IA chinesa.

O Regulamentação chinesa em matéria de IA que entrarão em vigor na próxima semana, também abrandarão o ritmo dos criadores de IA generativa, à medida que estes percorrem o processo burocrático de obtenção de licenças de IA junto das autoridades.

As empresas tecnológicas chinesas, como a Alibaba, esperam conseguir ultrapassar alguns destes desafios e conseguir uma maior adoção fora do seu mercado nacional. Isso pode ser consideravelmente mais fácil do que para os criadores de modelos pagos, como a OpenAI e a Google, encontrarem tração na China.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Eugene van der Watt

Eugene vem de uma formação em engenharia eletrónica e adora tudo o que é tecnologia. Quando faz uma pausa no consumo de notícias sobre IA, pode encontrá-lo à mesa de snooker.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições