Google бросает вызов Gemini, своей новой большой языковой модели (LLM).
Проект Gemini, разработанный в основном компанией Google DeepMind, сигнализирует о предстоящем противостоянии с ChatGPT от OpenAI.
Информация сообщила, что Google предоставила ранний доступ к Gemini избранной группе разработчиков, подразумевая, что бета-релиз не за горами.
Поскольку Google объединяет свои значительные ресурсы с исследовательскими лабораториями Brain и DeepMind, потенциальное влияние Gemini на индустрию искусственного интеллекта может быть огромным.
В то время как OpenAI ворвался на сцену ИИ и захватил контроль над публичными пользователями с помощью ChatGPT, Google поддерживается десятилетия исследований в области искусственного интеллекта и владеет значительными запатентованными базами данных.
Генеральный директор Google Сундар Пичаи представил Gemini на конференции разработчиков Google I/O в мае 2023 года. Он заявил, что Gemini разработан "с нуля, чтобы быть мультимодальным", сочетая сильные стороны системы AlphaGo от DeepMind с мощными возможностями языкового моделирования.
Демис Хассабис, генеральный директор DeepMind, добавил больше контекста, заявив, что Gemini - это не одна модель, а скорее "серия моделей", и, скорее всего, она будет работать с текстом, изображениями, а возможно, даже с речью и аудио.
Это похоже на направление развития Google Bard, в котором реализована функция работы с изображениями благодаря Google Lens.
По словам Пичаи, будущие усовершенствования могут включать такие функции, как "память и планирование, которые позволят выполнять задачи, требующие рассуждений".
Главный научный сотрудник Google Джеффри Дин сообщил, что Gemini будет использовать новую инфраструктуру искусственного интеллекта Google Pathways для расширения масштабов обучения на различных наборах данных.
Дин намекнул, что потенциально система может превысить размер GPT-3 от OpenAI, который содержит более 175 миллиардов параметров, но это означает, что Gemini будет отставать от GPT-4 на целое поколение.
Однако количество параметров - это еще не все, и Близнецы могут отличаться от других магистрантов и по другим параметрам.
Например, помимо работы с несколькими типами данных, Хассабис отметил, что Gemini может проводить перекрестную проверку информации с помощью Google Search.
Реакция промышленности
Хассабис сообщил, что Gemini демонстрирует "очень многообещающие первые результаты" в сентябрьском докладе. интервью изданию Time.
Доклад Полуанализ утверждает, что Gemini превышает 430 миллиардов параметров, что значительно больше, чем оценка GPT-3 в 200 миллиардов. Количество параметров GPT-4 неизвестно, хотя, согласно нескольким анализам, оно составляет около 1 триллиона.
В сообщении Semi Analysis также утверждается, что Gemini "разгромит" GPT-4 в 5 раз по количеству обучающих флопсов, а в планах - в 20 раз. Хотя это и спекулятивно, но означает, что Gemini значительно мощнее GPT-4 в вычислительном плане.
В сообщении говорится: "Хватит ли у Google духу выложить эти модели на всеобщее обозрение без ущерба для их творчества или существующей бизнес-модели - это уже другой разговор".
Как сказал Сундар Пичаи, сегодняшние чат-боты "покажутся тривиальными" по сравнению с ними через несколько лет.
Однако удастся ли Gemini прервать господство GPT-4, пока неизвестно.