Le développeur chinois d'IA, SenseTime, a dévoilé son modèle multimodal amélioré SenseNova 5.5 et affirme qu'il représente l'état de l'art.
Ce nouveau modèle arrive quelques mois seulement après la sortie de SenseNova 5, qui, selon SenseTime, était comparable à GPT-4 Turbo.
Le paramètre 600B mis à jour SenseNova 5.5 représenterait une amélioration de 30% de la performance globale.
Les scores de référence publiés par l'entreprise montrent que son modèle bat le GPT-4o et les modèles Claude Sonnet 3.5 d'Anthropic.
Les critères de référence dans lesquels SenseNova 5.5 excelle sont ceux qui sont généralement utilisés pour les modèles chinois. S'ils utilisaient les critères GPQA, Humaneval ou Math, nous pourrions faire une comparaison plus juste, mais même dans ce cas, ces chiffres sont impressionnants.
SenseTime a également présenté SenseNova 5o, le premier modèle multimodal en temps réel de Chine, capable de traiter du texte, des images, de l'audio et de la vidéo.
La démo du SenseNova 5o qui a interagi sur scène a montré qu'il fonctionnait de la même manière que la démo du GPT-4o, sur lequel nous attendons toujours de mettre la main.
SenseTime affirme que les interactions de SenseNova 5o sont "à la hauteur des capacités d'interaction en continu de GPT-4o".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8 juillet 2024
L'entreprise a également dévoilé une version "Lite" de SenseNova 5.5, qui est un modèle à faible coût destiné à fonctionner sur l'appareil.
SenseTime affirme que son modèle côté bord de mer ne coûtera que 9,90 RMB par an et par appareil, mais n'a pas donné de chiffres sur les performances.
Dans le cadre de SenseNova 5.5, SenseTime a également lancé Vimi, un générateur vidéo d'avatars IA contrôlables.
Vimi peut générer des vidéos d'une durée maximale d'une minute à partir d'une simple photo. Il permet également de contrôler avec précision les expressions faciales et les mouvements du haut du corps d'un avatar.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9 juillet 2024
La sortie d'OpenAI de la Chine
Conformément aux sanctions américaines sur les exportations de technologies vers la Chine, OpenAI bloquera l'accès à ses outils et services pour les utilisateurs chinois.
Le gouvernement chinois bloque déjà ChatGPT, mais les utilisateurs ont réussi à contourner le pare-feu du gouvernement en utilisant des VPN. OpenAI n'a pas encore expliqué pourquoi, mais elle bloquera cette solution de contournement à partir d'aujourd'hui.
Cette situation a provoqué une course effrénée, les entreprises chinoises cherchant des alternatives aux modèles d'OpenAI. SenseTime a annoncé le lancement de son projet "Project $0 Go" pour attirer les utilisateurs sur sa plateforme.
Il s'agit d'une offre gratuite et complète pour aider les nouvelles entreprises utilisatrices à migrer des plateformes d'OpenAI vers SenseTime. Il comprend un crédit de 50 millions de jetons et des services de conseil pour la migration des API.
D'autres fournisseurs de modèles chinois ont également essayé de tirer profit de la sortie d'OpenAI. Baidu, Zhipu et Tencent ont tous offert entre 50 et 150 millions de jetons pour inciter les utilisateurs à migrer vers leurs plateformes.
Paradoxalement, le renforcement des sanctions américaines et le retrait d'OpenAI de la Chine devraient favoriser les progrès de l'IA locale, les entreprises chinoises capitalisant sur des revenus qui, jusqu'à présent, allaient aux États-Unis.
Les modèles SenseNova de SenseTime et Tongyi Qianwen d'Alibaba connaissent une forte augmentation des téléchargements et de l'engagement des clients.
Alors que les développeurs chinois rendent leurs fonctions multimodales accessibles au public, on peut se demander si les utilisateurs américains continueront à faire preuve de patience.
Attendront-ils qu'OpenAI et Google passent de la démo au produit ou verront-ils les utilisateurs américains adopter les modèles chinois ?