Компания Google анонсировала три новые модели семейства Gemini, выпустив их в качестве экспериментального релиза для сбора отзывов разработчиков.
Этот релиз является продолжением итерационного подхода Google, а не переходом сразу к Gemini 2.0. Экспериментальные модели представляют собой улучшенные версии Gemini 1.5 Pro и Gemini 1.5 Flash, а также новая более компактная модель Gemini 1.5 Flash-8B.
Руководитель отдела продуктов Google Логан Килпатрик заявил, что Google выпускает экспериментальные модели "для того, чтобы собрать отзывы и передать наши последние обновления в руки разработчиков. То, что мы узнаем в ходе экспериментальных запусков, служит основой для более широкого выпуска моделей".
По словам Google, обновленная версия Gemini 1.5 Pro значительно превосходит предыдущую, в ней улучшены возможности кодирования и обработки сложных запросов. Модели Gemini 1.5 созданы для работы с очень длинными контекстами и могут вспоминать и рассуждать о тонкой информации, содержащей не менее 10 миллионов лексем. Экспериментальные модели имеют ограничение в 1 М лексем.
Gemini 1.5 Flash - это более дешевая модель с низким уровнем задержек, предназначенная для решения задач большого объема и обобщения мультимодальных данных в длинных контекстах. В ходе первого тестирования экспериментальных версий улучшенные модели Pro и Flash поднялись на лидирующие позиции в рейтинге LMSYS.
Чатбот Арена обновляется⚡!
Последние Gemini (Pro/Flash/Flash-9b) результаты уже известны, более 20 тысяч голосов в сообществе!
Основные моменты:
- Новый Gemini-1.5-Flash (0827) совершает огромный скачок, поднявшись с #23 до #6 в целом!
- Новый Gemini-1.5-Pro (0827) демонстрирует значительные успехи в кодировании, математике и... https://t.co/6j6EiSyy41 pic.twitter.com/D3XpU0Xiw2- lmsys.org (@lmsysorg) 27 августа 2024 года
Gemini Flash 8B
Когда компания Google выпустила Gemini 1.5 технический отчет ранее в этом месяце, он продемонстрировал некоторые ранние работы команды Google DeepMind над еще меньшим вариантом модели Gemini 1.5 Flash с 8 миллиардами параметров.
Экспериментальная мультимодальная модель Gemini 1.5 Flash-8B уже доступна для тестирования. Бенчмарк-тесты показывают, что она опережает легкую модель Gemma 2-9B от Google и значительно более крупную Llama 3-70B от Meta.
Идея Gemini 1.5 Flash-8B заключается в том, чтобы создать чрезвычайно быструю и очень дешевую модель, которая при этом обладала бы мультимодальными возможностями. Google утверждает, что она "может обеспечить работу интеллектуальных агентов, развернутых в масштабе, облегчая взаимодействие в реальном времени с большой базой пользователей". Flash-8B "предназначен для решения любых задач - от мультимодальных задач с большим объемом информации до длительных задач по обобщению контекста".
Разработчики, которым нужна легкая, дешевая и быстрая мультимодальная модель с контекстом 1M токенов, скорее всего, будут больше рады Gemini Flash-8B, чем улучшенным моделям Flash и Pro. Тем же, кто ищет более продвинутые модели, будет интересно узнать, когда Google выпустит Gemini 1.5 Ultra.