Anthropic выпускает Claude Sonnet 3.5, которая обыгрывает GPT-4o

24 июня 2024 года

  • Anthropic выпустила Claude Sonnet 3.5, которая стала самой мощной моделью, опередив Claude 3 Opus
  • Claude Sonnet 3.5 предлагает улучшенные возможности видения и кодирования, а также окно предварительного просмотра артефактов
  • Claude Sonnet 3.5 выигрывает у GPT-4o и Gemini 1.5 Pro в нескольких тестах бенчмарка MMLU

Компания Anthropic выпустила Claude Sonnet 3.5, который мощнее, быстрее и дешевле своей более крупной модели Claude 3 Opus.

Когда Anthropic выпустила свой Claude 3 семейства моделей в мартеОни выпускались в трех вариантах - Haiku, Sonnet и Opus, каждый из которых увеличивался в размерах, возможностях и стоимости жетонов.

Claude Sonnet 3.5 значительно интеллектуальнее своего более крупного предшественника, и в нем значительно расширены возможности обработки зрения и кодирования.

Он также намного быстрее и дешевле. Anthropic утверждает, что вывод с помощью Claude Sonnet 3.5 вдвое быстрее, чем Claude Opus 3, в 5 раз дешевле в пересчете на токен, а также имеет 200-килограммовое контекстное окно.

Всего за 3 месяца Claude Opus 3 стал ненужным, и Anthropic говорит, что мы можем ожидать обновленные версии 3.5 для Haiku и Opus "в ближайшее время".

Anthropic предоставила модель для бесплатного использования на своем сайте Claude.ai чат-интерфейс и приложение для iOS. Регистрация платной учетной записи дает вам более высокие тарифные лимиты и доступ к API.

Результаты бенчмарка Claude Sonnet 3.5

Claude Sonnet 3.5 не может искать информацию в Интернете или генерировать изображения, но его улучшенные возможности обработки зрения, математики, рассуждений и кодирования превосходят лидеров отрасли GPT-4o и Gemini Pro 1.5 в ряде бенчмарков.

Сравнение бенчмарков Claude Sonnet 3.5. Источник: Anthropic
Сравнение бенчмарков Claude Sonnet 3.5. Источник: Anthropic

Здесь выделяются показатели по визуальному математическому мышлению и кодированию, и именно улучшение навыков кодирования вызвало особый восторг у пользователей.

Артефакты

Функция "Артефакты" - интересное дополнение к интерфейсу веб-чата Claude. ChatGPT сгенерирует для вас код, но затем вам придется скопировать и вставить его в среду разработки, чтобы опробовать его.

Теперь у Клода есть дополнительное окно, открывающееся рядом с интерфейсом чата, в котором вы можете увидеть предварительный просмотр кода в реальном времени. Правки немедленно отражаются в окне "Артефакты".

Anthropic говорит, что Artifacts скоро будет поддерживать команды и позволит работать над проектами совместно. Будем надеяться, что ChatGPT скоро получит собственную версию Artifacts.

Компания Anthropic заявила, что подвергла Claude 3.5 Sonnet тщательным испытаниям на безопасность, а также передала его в британский Институт безопасности искусственного интеллекта (UK AISI) для оценки безопасности перед развертыванием.

Внутренняя оценка безопасности, опубликовано в карточке модели, классифицировал "Claude 3.5 Sonnet как модель AI Safety Level 2 (ASL-2), что указывает на отсутствие риска катастрофического вреда".

Компания Anthropic заявляет, что в дополнение к обновленным версиям моделей Haiku и Opus, в скором времени будут добавлены модальности, возможность запоминания и дополнительные функции интеграции с предприятиями.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения