Den kinesiska AI-utvecklaren SenseTime presenterade sin uppgraderade multimodala SenseNova 5.5-modell och hävdar att den representerar den senaste tekniken.
Den uppgraderade modellen kommer bara några månader efter lanseringen av SenseNova 5, som enligt SenseTime var i nivå med GPT-4 Turbo.
Den uppgraderade 600B-parametern SenseNova 5.5 representerar enligt uppgift en 30% förbättring av den totala prestandan.
De benchmarkresultat som företaget släppt visar att deras modell slår GPT-4o och Anthropics Claude Sonnet 3.5-modeller.
De riktmärken som SenseNova 5.5 utmärker sig med är de som vanligtvis används för kinesiska modeller. Om de använde GPQA, Humaneval eller Math-riktmärken skulle vi kunna göra en mer rättvis jämförelse, men trots det ser dessa siffror imponerande ut.
SenseTime presenterade också SenseNova 5o, Kinas första multimodala realtidsmodell som kan bearbeta text, bilder, ljud och video.
Demonstrationen av SenseNova 5o på scenen visade att den fungerar ungefär som GPT-4o-demonstrationen som vi fortfarande väntar på att få lägga vantarna på.
SenseTime säger att SenseNova 5o:s interaktionsfunktioner är "i nivå med GPT-4o:s interaktionsfunktioner för streaming".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8 juli 2024
Företaget presenterade också en "Lite"-version av SenseNova 5.5, som är en moln-till-edge lågprismodell avsedd att köras på enheten.
SenseTime säger att deras edge-side-modell kommer att kosta så lite som 9,90 RMB per år och enhet, men gav inga prestandasiffror.
Som en del av SenseNova 5.5 lanserade SenseTime också Vimi, en kontrollerbar AI-avatarvideogenerator.
Vimi kan generera videor som är upp till en minut långa med ett enda foto som utgångspunkt. Det ger också möjlighet till exakt kontroll över en avatars ansiktsuttryck och överkroppsrörelser.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9 juli 2024
OpenAI:s kinesiska utträde
I linje med USA:s sanktioner mot teknikexport till Kina kommer OpenAI att blockera API-åtkomst till sina verktyg och tjänster för användare i Kina.
Den kinesiska regeringen blockerar redan ChatGPT men användare där har kunnat ta sig runt regeringens brandvägg med hjälp av VPN. OpenAI har inte helt förklarat varför men det kommer att blockera denna lösning från och med idag.
Detta har orsakat en galen förflyttning när kinesiska företag letar efter alternativ till OpenAI: s modeller. SenseTime tillkännagav lanseringen av sitt "Project $0 Go"-system för att locka användare till sin plattform.
Programmet är ett kostnadsfritt och omfattande introduktionspaket som hjälper nya företagsanvändare att migrera från OpenAI:s plattformar till SenseTime. Det inkluderar en kredit på 50 miljoner tokens och konsulttjänster för API-migrering.
Andra kinesiska modellleverantörer har också försökt tjäna pengar på OpenAI:s exit. Baidu, Zhipu och Tencent har alla erbjudit mellan 50 och 150 miljoner tokens som incitament för att migrera till deras plattformar.
Ironiskt nog kommer de skärpta amerikanska sanktionerna och OpenAI:s utträde ur Kina sannolikt att driva på utvecklingen av inhemsk AI när kinesiska företag kapitaliserar på intäkter som hittills gått till USA.
SenseTimes SenseNova och Alibabas Tongyi Qianwen-modeller ser en kraftig ökning av nedladdningar och kundengagemang.
När kinesiska utvecklare gör sina multimodala funktioner tillgängliga för allmänheten måste man fråga sig hur tålmodiga amerikanska användare kommer att fortsätta att vara.
Kommer de att vänta på att OpenAI och Google ska gå från demo till produkt eller kommer vi att få se amerikanska användare ta efter kinesiska modeller.