Обманула ли Google с впечатляющим демонстрационным видео Gemini?

9 декабря 2023 года

Видеоролик Google, демонстрирующий возможности новой модели Gemini, был просто потрясающим. К сожалению, правда о том, насколько хорош Gemini и что он может делать, не соответствует маркетинговой шумихе.

Когда мы впервые посмотрели демо-ролик, демонстрирующий взаимодействие Gemini с ведущим в режиме реального времени, мы были потрясены. Мы были настолько взволнованы, что пропустили несколько ключевых предупреждений в начале и приняли видео за чистую монету.

Текст в первые несколько секунд видеоролика гласит: "Мы снимали кадры, чтобы протестировать его в самых разных условиях, показывали ему серию изображений и просили его рассуждать о том, что он видит".

Что на самом деле происходило за кулисами - вот причина Критика, которой подверглась компания Google, и этические вопросы, которые она поднимает.

Близнецы не смотрели видео, на котором ведущий рисует утку или передвигает чашки. Не отвечал Близнец и на голосовые подсказки, которые вы слышали. Видео было стилизованной маркетинговой презентацией более простой истины.

В действительности Gemini были представлены неподвижные изображения и текстовые подсказки, которые были более подробными, чем вопросы, которые задает ведущий.

Представитель Google подтвердил, что слова, которые вы слышите в видеоролике, - это "реальные выдержки из реальных подсказок, использованных для создания последующего вывода Gemini".

Итак, подробные текстовые подсказки, неподвижные изображения и текстовые ответы. На самом деле Google продемонстрировала функциональность, которой GPT-4 обладает уже несколько месяцев.

GPT-4 идентифицирует рисунок утки. Источник: X / Итан Моллик

Сообщение в блоге Google показывает изображения и текстовые подсказки, которые были использованы на самом деле.

В примере с автомобилем ведущий спрашивает: "Исходя из их конструкции, какой из этих автомобилей поедет быстрее?"

На самом деле использовалась следующая подсказка: "Какой из этих автомобилей более аэродинамичен? Тот, что слева, или тот, что справа? Объясните, почему, используя конкретные визуальные детали".

И когда вы воссоздаете эксперимент на Bard, которым теперь управляют Близнецы, он не всегда получается правильным.

Бард выбирает не ту машину. Источник: Бард

Мне очень хотелось верить, что Близнецы смогут следить за шариком, когда три чашки будут перемещаться, но, к сожалению, это не так.

Из сообщения в блоге Google следует, что для демонстрации перестановки чашек потребовалось много подсказок и объяснений.

Подсказки для перестановки чашек. Источник: Google

То, что модель с искусственным интеллектом способна на такое, впечатляет, но это не то, что нам предлагали в видео.

Это все, Google?

Мы лишь предполагаем, но, скорее всего, демонстрация показывала результаты, полученные Google с помощью Gemini Ultra, которая до сих пор не выпущена.

Так что, когда Gemini Ultra в конце концов выйдет, похоже, он будет способен на то, что GPT-4 делает уже несколько месяцев. Последствия не самые лучшие.

Не достигли ли мы потолка в развитии возможностей ИИ? Ведь если лучшие умы в области ИИ работают в Google, то, несомненно, они должны быть движущей силой передовых инноваций.

Или Google не только не спешит вступать в гонку, но и не успевает за остальными? В бенчмарках, которые с гордостью демонстрирует Google, видно, что ее еще не вышедшая модель незначительно опережает GPT-4 в некоторых тестах. Как она поведет себя в GPT-5?

А может быть, маркетинговый отдел Google допустил оплошность с видео, но Gemini Ultra все равно будет лучше, чем мы думаем. Google утверждает, что Gemini действительно мультимодальный и понимает видео, что действительно будет первым для LLM.

Мы еще не видели, как LLM демонстрирует видеопонимание, но когда это произойдет, будет повод для радости. Что покажет нам Gemini Ultra или GPT-5?

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения