Китайская компания SenseTime, разработчик искусственного интеллекта, представила обновленную мультимодальную модель SenseNova 5.5 и утверждает, что она является передовым достижением.
Обновленная модель появилась всего через несколько месяцев после выпуска SenseNova 5, которая, по словам SenseTime, была наравне с GPT-4 Turbo.
Обновленный параметр 600B SenseNova 5.5, как сообщается, представляет собой улучшение общей производительности на 30%.
По результатам бенчмарков, опубликованных компанией, ее модель опережает модели GPT-4o и Claude Sonnet 3.5 от Anthropic.
В бенчмарках SenseNova 5.5 преуспевает в тех, которые обычно используются для китайских моделей. Если бы они использовали бенчмарки GPQA, Humaneval или Math, мы могли бы провести более корректное сравнение, но и так эти показатели выглядят впечатляюще.
SenseTime также представила SenseNova 5o, первую в Китае мультимодальную модель реального времени, способную обрабатывать текст, изображения, аудио и видео.
Демонстрация SenseNova 5o на сцене показала, что она работает так же, как и GPT-4o, который мы все еще ждем, чтобы получить в свои руки.
SenseTime утверждает, что возможности взаимодействия SenseNova 5o "не уступают возможностям потокового взаимодействия GPT-4o".
Claude 3.5/GPT-4oを超える生成AI、SenseNova 5.5が発表されました。
また、マルチモーダルモデル、SenseNova 5oも同時に発表されたようです。SenseNova 5.0と比較してパフォーマンスが30%向上し、数学や英語を中心に多くのコア指標がGPT-4oの標準を上回っているとのこと。pic.twitter.com/H1u98SFVwX
- 江藤圭一|Radineer (@RadineerE10) 8 июля 2024 года
Компания также представила "Lite" версию SenseNova 5.5, которая представляет собой облачную недорогую модель, предназначенную для работы на устройстве.
Компания SenseTime утверждает, что ее модель для пограничных устройств будет стоить всего 9,90 юаней в год на одно устройство, но не предоставила никаких данных о производительности.
В рамках SenseNova 5.5 компания SenseTime также выпустила Vimi, управляемый видеогенератор аватаров с искусственным интеллектом.
Vimi может создавать видео длиной до одной минуты, используя в качестве подсказки одну фотографию. Он также позволяет точно контролировать мимику и движения верхней части тела аватара.
さらに
・音声
・テキスト
・画像
・動画
を処理できるリアルタイム・マルチモーダルモデル、SenseNova 5oも公開pic.twitter.com/CKs0JyaH1m- あるる ChatGPT × AIツール (@chatgptair) 9 июля 2024 года
Выход OpenAI из Китая
В соответствии с американскими санкциями на экспорт технологий в Китай, OpenAI заблокирует доступ к API своих инструментов и сервисов для пользователей в Китае.
Китайское правительство уже блокирует ChatGPT, но пользователи смогли обойти правительственный брандмауэр с помощью VPN. OpenAI не объяснила причину, но с сегодняшнего дня она будет блокировать этот обходной путь.
Это вызвало безумную суматоху, поскольку китайские компании ищут альтернативы моделям OpenAI. SenseTime объявила о запуске схемы "Project $0 Go", чтобы привлечь пользователей к своей платформе.
Схема представляет собой бесплатный комплексный пакет услуг по миграции, который поможет новым корпоративным пользователям перейти с платформ OpenAI на SenseTime. Он включает в себя кредит в размере 50 миллионов токенов и консультационные услуги по миграции API.
Другие китайские поставщики моделей также пытаются заработать на выходе OpenAI. Baidu, Zhipu и Tencent предложили от 50 до 150 миллионов токенов в качестве стимула для перехода на их платформы.
По иронии судьбы, ужесточение американских санкций и выход OpenAI из Китая, скорее всего, будут способствовать развитию отечественного ИИ, поскольку китайские компании будут получать прибыль, которая до сих пор уходила в США.
Модели SenseNova от SenseTime и Tongyi Qianwen от Alibaba демонстрируют резкий рост числа загрузок и вовлеченности клиентов.
Пока китайские разработчики делают свои мультимодальные функции общедоступными, стоит задуматься, насколько терпеливыми будут американские пользователи.
Будут ли они ждать, пока OpenAI и Google перейдут от демонстрации к продукту, или мы увидим, как американские пользователи перенимают китайские модели.