OpenAI представляет серию "o1", расширяющую границы разумного ИИ

12 сентября 2024 года

  • OpenAI выпускает две новые усовершенствованные модели: o1-preview и o1-mini
  • Они способны к многоступенчатым рассуждениям, что идеально подходит для сложных вопросов
  • o1-preview уже доказал свое превосходство над GPT-4o при выполнении некоторых задач
o1

Компания OpenAI выпустила новые усовершенствованные модели рассуждений, получившие название серии "o1". 

В настоящее время o1 выпускается в двух версиях - o1-preview и o1-mini - и предназначен для выполнения сложных задач рассуждения, знаменуя собой то, что OpenAI называет "новой парадигмой" в развитии ИИ.

"Это то, что мы считаем новой парадигмой в этих моделях", - пояснила Мира Мурати, главный технический директор OpenAI, в интервью. заявление для Проводной. "Он гораздо лучше справляется с очень сложными задачами, связанными с рассуждениями".

В отличие от предыдущих итераций, которые преуспевали прежде всего в масштабе, например, бросая вычисления на проблему, o1 стремится воспроизвести человеческий мыслительный процесс "осмысления" проблем. 

Вместо того чтобы генерировать один ответ, модель работает шаг за шагом, рассматривая несколько подходов и пересматривая себя по мере необходимости - этот метод известен как "цепочка размышлений". 

Это позволяет ему решать сложные задачи в математике, кодировании и других областях с уровнем точности, которого не могут достичь существующие модели, включая GPT-4o.

Марк Чен, вице-президент OpenAI по исследованиям, подробно рассказал о процессе обучения o1 и о том, чем он отличается от типичных рассуждений языковых моделей. "Модель оттачивает свое мышление и настраивает стратегии, которые она использует для получения ответа", - сказал Чен. 

Он продемонстрировал модель на примере нескольких математических головоломок и вопросов по химии, которые раньше ставили GPT-4o в тупик. 

Одна из загадок, которая озадачила предыдущие модели, гласила: "Принцессе столько лет, сколько будет принцу, если принцессе вдвое больше лет, чем было принцу, когда возраст принцессы был равен половине суммы их нынешних возрастов. Каков возраст принца и принцессы?". 

Модель o1 определила правильный ответ: принцу 30 лет, а принцессе - 40.

Как получить доступ к o1

Пользователи ChatGPT Plus уже могут получить доступ к o1 из ChatGPT.

Это удивительно, ведь голосовая функция GPT-4o все еще работает спустя несколько месяцев после ее демонстрации. Мало кто ожидал, что o1 будет запущен так внезапно, минуя обычную подготовку.

o1

o1, похоже, связан с проектом OpenAI под кодовым названием "Клубника". Забавная вещь: большинство моделей ИИ не знают, сколько "р" в слове "клубника". Это мешает им рассуждать.

Я проверил это в o1. И вот, пожалуйста, все получилось. Очевидно, что подход o1 к рассуждениям помогает эффективно решать подобные вопросы.

Недавняя активность Сэма Альтмана в социальных сетях, связанная с клубникой, может быть связана с этой знаменитой проблемой ИИ со вкусом клубники и кодовым названием o1 "Проект Клубника". Если нет, то это странное совпадение.

Шаг за шагом в решении проблем

Способность модели o1 "рассуждать", решая проблемы, представляет собой прогресс в области искусственного интеллекта, который может оказаться весьма революционным, если его работа будет доказана в реальных условиях.

Новые модели уже показали высокие результаты в таких тестах, как American Invitational Mathematics Examination (AIME). 

По данным OpenAI, новая модель решила 83% задач, представленных в AIME, по сравнению со всего 12% у GPT-4o.

Хотя сильные стороны o1 очевидны, у него есть и недостатки.

Модель требует больше времени для получения ответов из-за более продуманной методологии. Время покажет, насколько сильно это повлияет на общее удобство использования. 

Странное происхождение o1

o1 появился на фоне разговоров о проекте OpenAI. под кодовым названием "Клубника". который появился в конце 2023 года.

Изначально ходили слухи, что это модель ИИ, способная автономно исследовать веб-страницы и предназначенная для проведения "глубоких исследований".

Разговоры вокруг Strawberry усилились не так давно, когда в The Information просочилась информация о внутренних проектах OpenAI. А именно, OpenAI якобы разрабатывает две формы Strawberry.

  1. Одна из них - это уменьшенная, упрощенная версия, предназначенная для интеграции в ChatGPT. Она призвана расширить возможности рассуждений в сценариях, где пользователям требуются более вдумчивые, подробные ответы, а не быстрые. Похоже, это может быть o1.
  2. Другая, более крупная и мощная версия используется для создания высококачественных "синтетических" обучающих данных для следующей флагманской языковой модели OpenAI под кодовым названием "Орион". Она может быть связана с o1, а может и не быть.

OpenAI не предоставила прямых разъяснений по поводу того, чем на самом деле является Strawberry. Однако многие считают, что o1 - это Strawberry.

Дополнение, а не замена

Мурати подчеркнул, что o1 разработан не для замены GPT-4o, а для его дополнения. 

"Есть две парадигмы, - говорит она. "Парадигма масштабирования и эта новая парадигма. Мы ожидаем, что объединим их". 

Пока OpenAI продолжает разрабатывать GPT-5, который, вероятно, будет еще больше и мощнее, чем GPT-4o, будущие модели могут включать в себя функции рассуждения из o1. 

Такое объединение может решить проблемы, связанные с постоянными ограничениями больших языковых моделей (LLM), например, их неспособностью решать, казалось бы, простые задачи, требующие логического вывода, например, вышеупомянутую задачу о клубнике. 

Компании Anthropic и Google, как утверждается, стремятся внедрить в свои модели аналогичные функции. Например, проект AlphaProof от Google также сочетает языковые модели с обучением с подкреплением для решения сложных математических задач. 

Однако Чен считает, что у OpenAI есть преимущество. "Я думаю, что нам удалось добиться некоторых успехов в этой области, - сказал он, - Я думаю, что это часть нашего преимущества. На самом деле она довольно хороша в рассуждениях во всех областях".

Йошуа Бенгио, ведущий исследователь в области ИИ и лауреат престижной премии Тьюринга, приветствует прогресс, но призывает к осторожности.

 "Если бы системы ИИ демонстрировали подлинное мышление, это позволило бы обеспечить последовательность фактов, аргументов и выводов, сделанных ИИ". сказал он в интервью FT.

Безопасность и этические соображения

В рамках своей приверженности ответственному ИИ OpenAI укрепила функции безопасности o1, включая инструменты безопасности контента "по умолчанию". 

Эти инструменты помогают предотвратить получение моделью вредных или небезопасных результатов.

"Мы рады сообщить, что щиты Prompt Shields и защищенные материалы для текста стали общедоступными в службе Azure OpenAI, - говорится в сообщении OpenAI. Сообщение в блоге Microsoft

Серия o1 доступна для раннего доступа в Azure AI Studio и GitHub Models от Microsoft, а более широкий релиз запланирован на ближайшее время. 

OpenAI надеется, что o1 позволит разработчикам и предприятиям внедрять инновации с меньшими затратами, что согласуется с их более широкой миссией - сделать ИИ более доступным для корпоративных пользователей. 

"Мы считаем, что это позволит нам дешевле поставлять интеллектуальные системы", - заключил Чен. "И я думаю, что это действительно основная миссия нашей компании".

В целом, это захватывающий релиз. Будет очень интересно посмотреть, над какими вопросами, проблемами и задачами будет работать o1.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения