Meta выпустила две версии модели Llama 3, а третья скоро появится

Компания Meta выпустила долгожданную серию Llama 3. Первые две модели, Llama 3-8B и Llama 3-70B, уже поступили в широкую продажу.

Несколько дней назад на мероприятие в ЛондонеВ этом месяце руководители Meta Ник Клегг и Янн ЛеКун заявили, что Llama 3 не за горами.

Первые две версии вышли сегодня, став третьей и четвертой крупными открытыми моделями, выпущенными в этом месяце. Grok-1.5V от xAI и Мистраль 8 сезон 22 серия.

Ллама 3 предварительно обучен на впечатляющих 15 триллионах лексем, что в 7 раз больше, чем в Llama 2. Данные предварительного обучения также включают в четыре раза больше кода.

Под капотом Llama 3 представлены такие архитектурные улучшения, как более эффективный токенизатор с большим словарным запасом в 128 тыс. лексем.

Вот краткая информация о производительности Llama 3:

Производительность Llama 3 8B:

По ряду показателей превосходит такие модели, как Mistral 7B и Gemma 7B от Google.
Отлично справляется с заданиями MMLU, ARC, DROP, GPQA (преимущественно научные вопросы), HumanEval (генерация кода), GSM-8K (математические задачи), MATH (математический бенчмарк), AGIEval (решение задач) и BIG-Bench Hard (рассуждения на основе здравого смысла).

70B в сравнении с другими моделями:

Llama 3 70B конкурирует с лучшими моделями ИИ, такими как Gemini 1.5 Pro от Google.
Beats Gemini 1.5 Pro в MMLU, HumanEval и GSM-8K.
По пяти бенчмаркам он превосходит Claude 3 Sonnet от Anthropic (средний уровень серии Claude 3): MMLU, GPQA, HumanEval, GSM-8K и MATH.

Эталоны Llama 3 8B и 70B. Источник: Meta

Это отличные показатели для открытой модели (хотя лицензия Meta имеет некоторые ограничения).

Это делает Llama 3 новой лучшей бесплатной моделью с открытым исходным кодом (вроде бы).

Llama 3 также будет более удобной и менее упорной в использовании - меньше отказов и более высокая точность в вопросах о мелочах, исторических фактах и STEM-запросах.

Llama 3 должна стать широко доступной на основных платформах, включая облачные сервисы и поставщиков API.

Meta уже работает над расширением Llama 3 до 400 миллиардов параметров и добавлением новых функций, таких как мультимодальность, многоязыковая поддержка и расширенное контекстное понимание.

Роль Мета-изгоя в генеративном ИИ

Во многих отношениях Meta стала бунтарем в индустрии генеративного ИИ.

Главный научный сотрудник по искусственному интеллекту компании Meta Ян ЛеКун, один из самых уважаемых деятелей в области искусственного интеллекта, придерживается мнения, которое некоторые расценивают как особые мнения о направлении искусственного интеллекта - взгляды, критикующие проекты с закрытым исходным кодом у конкурентов Meta по Большим Технологиям.

Тем временем бывший заместитель премьер-министра Великобритании Ник Клегг, возглавляющий отдел по глобальным вопросам, получил нарекания за порой несерьезное отношение к продуктам Meta, связанным с искусственным интеллектом, что, возможно, не удивит никого из британцев.

На прошлой неделе Клегг, похоже, преуменьшил влияние ИИ на предвыборную агитацию и манипуляции с фальшивками. Это мнение очень сильно противоречит преобладающему мнению о том, что глубокие фальшивки могут быть (или уже являются) глубоко разрушительными.

На самом деле, Наблюдательный совет Меты - это активно расследует два случая глубокой подделки порнографии прямо сейчас. Совет посчитал, что действия Meta по модерации контента были слишком медленными.

Компания Meta также заявляет о повышении качества своих моделей. Жоэль Пино, вице-президент Meta по исследованиям в области ИИ, сказал: "Во многих отношениях модели, которые мы имеем сегодня, будут детскими играми по сравнению с моделями, которые появятся через пять лет".

Пино также предупредил: "Если мы будем продолжать наращивать общую и мощную модель, не социализируя ее должным образом, у нас возникнет большая проблема".

Выпуск Llama 3 также произошел на фоне того, как ИИ-агенты Meta в Facebook вызвали переполох в социальных сетях.

В группе Facebook для нью-йоркских родителей был представлен ИИ-помощник Meta, призванный давать советы и отвечать на вопросы. шокированные люди утверждая, что у него "одаренный ребенок с ограниченными возможностями", посещающий специальную школу для "одаренных и талантливых".

Когда члены группы столкнулись с ним, ИИ признался: "Я всего лишь большая языковая модель, у меня нет личного опыта или детей", что некоторые назвали инцидентом в духе "Черного зеркала".

Модели Llama 3, Grok-1.5 и Mistral передают больше полномочий сообществам с открытыми исходными кодами, при этом еще больше размывая рынок генеративного ИИ.

Но это может быть и хорошо, ведь сейчас речь идет о выживании сильнейших, и мяч находится в лагере Microsoft-OpenAI, который, как ожидается, сделает следующий ход в этой увлекательной игре в шахматы с искусственным интеллектом.

Meta выпускает две версии модели Llama 3, третья неминуема

Роль Мета-изгоя в генеративном ИИ

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Meta выпускает две версии модели Llama 3, третья неминуема

Роль Мета-изгоя в генеративном ИИ

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDFБудьте впереди с DailyAI

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI