Alibaba a publié sur sa plateforme d'informatique en nuage deux modèles linguistiques de grande taille en source ouverte, qui devraient concurrencer la plus petite version du modèle Llama 2 de Meta.
L'entreprise technologique chinoise a publié son modèle Tongyi Qiawen au début de l'année et affirme que les nouvelles versions, Qwen-7B et Qwen-7B-Chat, sont des versions réduites de ce LLM. Le "7B" dans les noms des modèles fait référence au fait qu'ils ont été entraînés sur 7 milliards de paramètres, soit la même quantité que la plus petite version du Llama 2 de Meta.
Le fait de disposer de modèles pré-entraînés représente un gain de temps et d'argent considérable pour les entreprises qui souhaitent utiliser des modèles d'IA dans leurs applications.
Alibaba a adopté une approche similaire pour Sortie du Llama 2 de Meta en rendant ses petits modèles open-source et libres d'être mis en œuvre par des développeurs tiers. L'entreprise espère ainsi favoriser l'adoption et l'expérimentation de ses modèles dans le monde réel.
À l'instar de Meta, Alibaba qualifie les modèles de "source ouverte", ce qui n'est pas tout à fait vrai. Les exigences d'utilisation sont similaires à celles de Llama 2, les entreprises ayant 100 millions d'utilisateurs par mois devant obtenir une licence d'Alibaba.
Bien que les modèles soient disponibles gratuitement pour la plupart des utilisateurs, Alibaba en tirera un avantage financier en faisant payer les utilisateurs de sa plateforme d'informatique en nuage pour les faire fonctionner. Alibaba n'a pas encore l'intention de publier son plus grand modèle gratuitement ou en code source libre. Alibaba fabrique également le Llama 2 Il sera donc intéressant de voir comment l'adoption de ces modèles concurrents se déroulera.
La nouvelle intervient environ deux semaines après qu'Alibaba a annoncé des mises à jour de sa plateforme d'informatique en nuage.
Elle a mis à jour son sur son service d'entreposage de données AnalyticDB qui, selon l'entreprise, accélérera considérablement la création d'applications d'IA générative. Elle affirme que des applications d'IA préconfigurées peuvent être créées en 30 minutes seulement.
L'initiative d'Alibaba est révélatrice de l'intensification de la course à l'IA entre la Chine et les États-Unis. D'autres géants chinois de la technologie, Huawei et Tencent, ont également travaillé sur leurs propres modèles et des annonces sur ces fronts sont attendues prochainement.
Malgré l'appétit insatiable pour les applications de l'IA, les restrictions américaines à l'exportation de puces et les pénurie mondiale de GPU haut de gamme ralentissent quelque peu le rythme du développement de l'IA en Chine.
Les Réglementation chinoise en matière d'IA qui entreront en vigueur la semaine prochaine, ralentiront également le rythme des développeurs d'IA générative, qui devront se frayer un chemin dans le processus bureaucratique d'obtention des licences d'IA auprès des autorités.
Les entreprises technologiques chinoises comme Alibaba espèrent pouvoir surmonter certains de ces défis et obtenir une plus grande adoption en dehors de leur marché national. Cela pourrait être beaucoup plus facile que pour les développeurs de modèles payants comme OpenAI et Google de trouver une traction en Chine.