Den kinesiske AI-udvikler SenseTime afslørede sin opgraderede multimodale SenseNova 5.5-model og hævder, at den repræsenterer det nyeste inden for området.
Den opgraderede model kommer kun få måneder efter udgivelsen af SenseNova 5, som ifølge SenseTime var på niveau med GPT-4 Turbo.
Den opgraderede 600B-parameter SenseNova 5.5 repræsenterer angiveligt en forbedring på 30% i den samlede ydeevne.
De benchmark-scores, som virksomheden har offentliggjort, viser, at dens model slår GPT-4o og Anthropics Claude Sonnet 3.5-modeller.
De benchmarks, SenseNova 5.5 udmærker sig ved, er dem, der typisk bruges til kinesiske modeller. Hvis de brugte GPQA-, Humaneval- eller Math-benchmarks, kunne vi lave en mere retfærdig sammenligning, men tallene ser alligevel imponerende ud.
SenseTime afslørede også SenseNova 5o, Kinas første multimodale model i realtid, der kan behandle tekst, billeder, lyd og video.
Demoen af SenseNova 5o på scenen viste, at den fungerede stort set som GPT-4o-demoen, som vi stadig venter på at få fingrene i.
SenseTime siger, at SenseNova 5o's interaktioner er "på niveau med GPT-4o's streaming-interaktionsfunktioner".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8. juli 2024
Virksomheden afslørede også en "Lite"-version af SenseNova 5.5, som er en cloud-to-edge lavprismodel, der er beregnet til at køre på enheden.
SenseTime siger, at deres edge-side-model vil koste så lidt som 9,90 RMB om året pr. enhed, men kom ikke med nogen tal for ydeevnen.
Som en del af SenseNova 5.5 udgav SenseTime også Vimi, en kontrollerbar AI-avatar-videogenerator.
Vimi kan generere videoer på op til et minut ved hjælp af et enkelt foto som ledetråd. Det giver også mulighed for præcis kontrol over en avatars ansigtsudtryk og overkropsbevægelser.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9. juli 2024
OpenAI's kinesiske exit
I overensstemmelse med USA's sanktioner mod teknologieksport til Kina vil OpenAI blokere API-adgangen til sine værktøjer og tjenester for brugere i Kina.
Den kinesiske regering blokerer allerede ChatGPT, men brugere der har været i stand til at komme uden om regeringens firewall ved hjælp af VPN'er. OpenAI har ikke helt forklaret hvorfor, men de vil blokere denne løsning fra og med i dag.
Det har skabt en vild kamp, hvor kinesiske virksomheder leder efter alternativer til OpenAI's modeller. SenseTime annoncerede lanceringen af sin "Project $0 Go"-ordning for at lokke brugere til sin platform.
Ordningen er en gratis og omfattende onboarding-pakke, der skal hjælpe nye virksomhedsbrugere med at migrere fra OpenAI's platforme til SenseTime. Det omfatter en kredit på 50 millioner tokens og konsulenttjenester til API-migrering.
Andre kinesiske modelleverandører har også forsøgt at tjene penge på OpenAI's exit. Baidu, Zhipu og Tencent har alle tilbudt mellem 50 og 150 mio. tokens som incitament til at migrere til deres platforme.
Ironisk nok vil de skærpede amerikanske sanktioner og OpenAI's exit fra Kina sandsynligvis drive den hjemlige AI-udvikling fremad, da kinesiske virksomheder udnytter indtægter, der indtil nu ville gå til USA.
SenseTimes SenseNova og Alibabas Tongyi Qianwen-modeller oplever en kraftig stigning i downloads og kundeengagement.
Når kinesiske udviklere gør deres multimodale funktioner offentligt tilgængelige, må man spørge sig selv, hvor tålmodige amerikanske brugere fortsat vil være.
Vil de vente på, at OpenAI og Google går fra demo til produkt, eller vil vi se amerikanske brugere tage kinesiske modeller til sig?