A empresa chinesa de desenvolvimento de IA, SenseTime, revelou o seu modelo multimodal atualizado SenseNova 5.5 e afirma que este representa o estado da arte.
O modelo atualizado surge apenas alguns meses após o lançamento do SenseNova 5 que, segundo a SenseTime, estava a par do GPT-4 Turbo.
O parâmetro 600B atualizado SenseNova 5.5 representa, alegadamente, uma melhoria de 30% no desempenho global.
As pontuações de referência que a empresa divulgou mostram o seu modelo a bater os modelos GPT-4o e Claude Sonnet 3.5 da Anthropic.
Os parâmetros de referência em que o SenseNova 5.5 se destaca são os normalmente utilizados para os modelos chineses. Se utilizassem os parâmetros de referência GPQA, Humaneval ou Math, poderíamos fazer uma comparação mais justa, mas, mesmo assim, estes valores são impressionantes.
A SenseTime revelou também o SenseNova 5o, o primeiro modelo multimodal em tempo real da China capaz de processar texto, imagens, áudio e vídeo.
A demonstração do SenseNova 5o em palco mostrou um desempenho muito semelhante ao da demonstração do GPT-4o, que ainda estamos à espera de ter nas nossas mãos.
A SenseTime afirma que as interacções do SenseNova 5o estão "a par das capacidades de interação em fluxo contínuo do GPT-4o".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8 de julho de 2024
A empresa também revelou uma versão "Lite" do SenseNova 5.5, que é um modelo de baixo custo, da nuvem para a ponta, destinado a ser executado no dispositivo.
A SenseTime afirma que o seu modelo de ponta custará apenas 9,90 RMB por ano e por dispositivo, mas não apresentou quaisquer valores de desempenho.
Como parte do SenseNova 5.5, a SenseTime também lançou o Vimi, um gerador de vídeo de avatar de IA controlável.
O Vimi pode gerar vídeos até um minuto de duração utilizando uma única fotografia como estímulo. Permite também controlar com precisão as expressões faciais e os movimentos da parte superior do corpo de um avatar.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9 de julho de 2024
A saída da OpenAI da China
Em conformidade com as sanções impostas pelos EUA às exportações de tecnologia para a China, a OpenAI bloqueará o acesso dos utilizadores chineses à API das suas ferramentas e serviços.
O governo chinês já bloqueia o ChatGPT, mas os utilizadores têm conseguido contornar a firewall do governo utilizando VPNs. A OpenAI ainda não explicou totalmente porquê, mas vai bloquear esta solução a partir de hoje.
Este facto provocou uma corrida desenfreada, com as empresas chinesas a procurarem alternativas aos modelos da OpenAI. A SenseTime anunciou o lançamento do seu projeto "Project $0 Go" para atrair os utilizadores para a sua plataforma.
O esquema é um pacote de integração gratuito e abrangente para ajudar os novos utilizadores empresariais a migrar das plataformas da OpenAI para a SenseTime. Inclui um crédito de 50 milhões de tokens e serviços de consultoria de migração de API.
Outros fornecedores de modelos chineses também têm tentado lucrar com a saída da OpenAI. Baidu, Zhipu e Tencent ofereceram entre 50 milhões e 150 milhões de tokens como incentivos para migrar para suas plataformas.
Ironicamente, o agravamento das sanções impostas pelos EUA e a saída da OpenAI da China irão provavelmente impulsionar os avanços da IA a nível nacional, à medida que as empresas chinesas capitalizam as receitas que, até agora, iam para os EUA.
Os modelos SenseNova, da SenseTime, e Tongyi Qianwen, da Alibaba, estão a registar um aumento nos downloads e na participação dos clientes.
À medida que os programadores chineses disponibilizam publicamente as suas funcionalidades multimodais, é de perguntar até que ponto os utilizadores americanos continuarão a ser pacientes.
Será que vão esperar que a OpenAI e a Google passem da demonstração ao produto ou será que os utilizadores americanos vão adotar os modelos chineses?