El desarrollador chino de inteligencia artificial SenseTime ha presentado su modelo multimodal SenseNova 5.5 actualizado y afirma que representa lo último en tecnología.
El modelo actualizado llega pocos meses después del lanzamiento de SenseNova 5, que según SenseTime estaba a la altura de GPT-4 Turbo.
Según los informes, el parámetro 600B actualizado SenseNova 5.5 representa una mejora de 30% en el rendimiento general.
Las puntuaciones de referencia publicadas por la empresa muestran que su modelo supera a los modelos GPT-4o y Claude Sonnet 3.5 de Anthropic.
Los puntos de referencia en los que destaca SenseNova 5.5 son los que se suelen utilizar para los modelos chinos. Si utilizaran GPQA, Humaneval o Math podríamos hacer una comparación más justa, pero aun así, estas cifras son impresionantes.
SenseTime también presentó SenseNova 5o, el primer modelo multimodal en tiempo real de China capaz de procesar texto, imágenes, audio y vídeo.
La demo de SenseNova 5o que interactuó en el escenario mostró un rendimiento muy parecido al de la demo de GPT-4o, que aún estamos esperando tener en nuestras manos.
SenseTime dice que las interacciones de SenseNova 5o están "a la par con las capacidades de interacción en streaming de GPT-4o".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8 de julio de 2024
La empresa también ha presentado una versión "Lite" de SenseNova 5.5, un modelo de bajo coste pensado para ejecutarse en el dispositivo.
SenseTime afirma que su modelo edge-side costará tan solo 9,90 RMB al año por dispositivo, pero no ofreció cifras de rendimiento.
Como parte de SenseNova 5.5, SenseTime también lanzó Vimi, un generador de vídeo avatar de IA controlable.
Vimi puede generar vídeos de hasta un minuto de duración a partir de una sola foto. También permite controlar con precisión las expresiones faciales y los movimientos de la parte superior del cuerpo de un avatar.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9 de julio de 2024
La salida china de OpenAI
En consonancia con las sanciones impuestas por EE.UU. a las exportaciones de tecnología a China, OpenAI bloqueará el acceso de los usuarios chinos a sus herramientas y servicios a través de la API.
El gobierno chino ya bloquea ChatGPT, pero los usuarios de ese país han podido sortear el cortafuegos del gobierno utilizando VPN. OpenAI no ha explicado por qué, pero a partir de hoy bloqueará esta solución.
Esto ha provocado una loca carrera en busca de alternativas a los modelos de OpenAI por parte de las empresas chinas. SenseTime anunció el lanzamiento de su "Proyecto $0 Go" para atraer a los usuarios a su plataforma.
Se trata de un paquete gratuito y completo para ayudar a los nuevos usuarios empresariales a migrar de las plataformas de OpenAI a SenseTime. Incluye un crédito de 50 millones de tokens y servicios de consultoría de migración de API.
Otros proveedores de modelos chinos también han intentado sacar provecho de la salida de OpenAI. Baidu, Zhipu y Tencent han ofrecido entre 50 y 150 millones de tokens como incentivo para migrar a sus plataformas.
Irónicamente, el endurecimiento de las sanciones estadounidenses y la salida de OpenAI de China impulsarán probablemente los avances de la IA nacional, ya que las empresas chinas capitalizarán unos ingresos que, hasta ahora, iban a parar a Estados Unidos.
Los modelos SenseNova, de SenseTime, y Tongyi Qianwen, de Alibaba, están experimentando un aumento de las descargas y la participación de los clientes.
A medida que los desarrolladores chinos ponen a disposición del público sus funciones multimodales, cabe preguntarse hasta qué punto seguirán siendo pacientes los usuarios estadounidenses.
¿Esperarán a que OpenAI y Google pasen de la demostración al producto o veremos a los usuarios estadounidenses adoptar los modelos chinos?