Den kinesiske AI-utvikleren SenseTime har avduket sin oppgraderte multimodale SenseNova 5.5-modell og hevder at den representerer det nyeste av det nyeste.
Den oppgraderte modellen kommer bare noen måneder etter lanseringen av SenseNova 5, som ifølge SenseTime var på nivå med GPT-4 Turbo.
Den oppgraderte 600B-parameteren SenseNova 5.5 representerer angivelig en forbedring på 30% i total ytelse.
Benchmark-scorene som selskapet har offentliggjort, viser at deres modell slår GPT-4o og Anthropics Claude Sonnet 3.5-modeller.
Referanseverdiene SenseNova 5.5 utmerker seg på, er de som vanligvis brukes for kinesiske modeller. Hvis de hadde brukt GPQA-, Humaneval- eller Math-benchmarks, kunne vi gjort en mer rettferdig sammenligning, men uansett ser disse tallene imponerende ut.
SenseTime presenterte også SenseNova 5o, Kinas første multimodale sanntidsmodell som kan behandle tekst, bilder, lyd og video.
Demoen av SenseNova 5o som ble vist på scenen, viste at den fungerer omtrent som GPT-4o-demoen, som vi fortsatt venter på å få tak i.
SenseTime sier at SenseNova 5os interaksjoner er "på nivå med GPT-4os interaksjonsfunksjoner for strømming".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8. juli 2024
Selskapet presenterte også en "Lite"-versjon av SenseNova 5.5, som er en lavprismodell fra sky til kant beregnet på å kjøre på enheten.
SenseTime sier at deres edge-side-modell vil koste så lite som 9,90 RMB per år per enhet, men oppga ingen ytelsestall.
Som en del av SenseNova 5.5 lanserte SenseTime også Vimi, en kontrollerbar AI-avatarvideogenerator.
Vimi kan generere videoer på opptil ett minutt ved hjelp av ett enkelt bilde. Det gir også mulighet for presis kontroll over avatarens ansiktsuttrykk og overkroppsbevegelser.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9. juli 2024
OpenAIs kinesiske exit
I tråd med USAs sanksjoner mot teknologieksport til Kina vil OpenAI blokkere API-tilgang til sine verktøy og tjenester for brukere i Kina.
Kinesiske myndigheter blokkerer allerede ChatGPT, men brukere der har klart å omgå myndighetenes brannmur ved hjelp av VPN-tjenester. OpenAI har ikke helt forklart hvorfor, men de vil blokkere denne løsningen fra og med i dag.
Dette har ført til et vanvittig kappløp der kinesiske selskaper ser etter alternativer til OpenAIs modeller. SenseTime kunngjorde lanseringen av "Project $0 Go" for å lokke brukere til plattformen sin.
Ordningen er et gratis og omfattende introduksjonspakke for å hjelpe nye bedriftsbrukere med å migrere fra OpenAIs plattformer til SenseTime. Det inkluderer en kreditt på 50 millioner tokens og konsulenttjenester for API-migrering.
Andre kinesiske modellleverandører har også forsøkt å tjene penger på OpenAIs exit. Baidu, Zhipu og Tencent har alle tilbudt mellom 50 og 150 millioner tokens som insentiver til å migrere til deres plattformer.
Ironisk nok vil de skjerpede amerikanske sanksjonene og OpenAIs uttreden fra Kina trolig drive frem utviklingen av egenutviklet AI, ettersom kinesiske selskaper vil kapitalisere på inntekter som til nå har gått til USA.
SenseTimes SenseNova og Alibabas Tongyi Qianwen-modeller opplever en kraftig økning i nedlastinger og kundeengasjement.
Etter hvert som kinesiske utviklere gjør sine multimodale funksjoner offentlig tilgjengelige, kan man lure på hvor tålmodige amerikanske brukere vil fortsette å være.
Vil de vente på at OpenAI og Google går fra demo til produkt, eller vil vi se amerikanske brukere ta i bruk kinesiske modeller?