OpenAI представляет серию "o1", расширяя границы разумности ИИ

Компания OpenAI выпустила новые усовершенствованные модели рассуждений, получившие название серии "o1".

В настоящее время o1 выпускается в двух версиях - o1-preview и o1-mini - и предназначен для выполнения сложных задач рассуждения, знаменуя собой то, что OpenAI называет "новой парадигмой" в развитии ИИ.

"Это то, что мы считаем новой парадигмой в этих моделях", - пояснила Мира Мурати, главный технический директор OpenAI, в интервью. заявление для Проводной. "Он гораздо лучше справляется с очень сложными задачами, связанными с рассуждениями".

В отличие от предыдущих итераций, которые преуспевали прежде всего в масштабе, например, бросая вычисления на проблему, o1 стремится воспроизвести человеческий мыслительный процесс "осмысления" проблем.

Вместо того чтобы генерировать один ответ, модель работает шаг за шагом, рассматривая несколько подходов и пересматривая себя по мере необходимости - этот метод известен как "цепочка размышлений".

Это позволяет ему решать сложные задачи в математике, кодировании и других областях с уровнем точности, которого не могут достичь существующие модели, включая GPT-4o.

Мы выпускаем предварительную версию OpenAI o1 - новая серия моделей ИИ, созданных для того, чтобы тратить больше времени на размышления перед тем, как ответить.

Эти модели могут решать сложные задачи и решать более сложные проблемы, чем предыдущие модели в науке, кодировании и математике. https://t.co/peKzzKX1bu

- OpenAI (@OpenAI) 12 сентября 2024 года

Марк Чен, вице-президент OpenAI по исследованиям, подробно рассказал о процессе обучения o1 и о том, чем он отличается от типичных рассуждений языковых моделей. "Модель оттачивает свое мышление и настраивает стратегии, которые она использует для получения ответа", - сказал Чен.

Он продемонстрировал модель на примере нескольких математических головоломок и вопросов по химии, которые раньше ставили GPT-4o в тупик.

Одна из загадок, которая озадачила предыдущие модели, гласила: "Принцессе столько лет, сколько будет принцу, если принцессе вдвое больше лет, чем было принцу, когда возраст принцессы был равен половине суммы их нынешних возрастов. Каков возраст принца и принцессы?".

Модель o1 определила правильный ответ: принцу 30 лет, а принцессе - 40.

Как получить доступ к o1

Пользователи ChatGPT Plus уже могут получить доступ к o1 из ChatGPT.

Это удивительно, ведь голосовая функция GPT-4o все еще работает спустя несколько месяцев после ее демонстрации. Мало кто ожидал, что o1 будет запущен так внезапно, минуя обычную подготовку.

o1, похоже, связан с проектом OpenAI под кодовым названием "Клубника". Забавная вещь: большинство моделей ИИ не знают, сколько "р" в слове "клубника". Это мешает им рассуждать.

Я проверил это в o1. И вот, пожалуйста, все получилось. Очевидно, что подход o1 к рассуждениям помогает эффективно решать подобные вопросы.

Недавняя активность Сэма Альтмана в социальных сетях, связанная с клубникой, может быть связана с этой знаменитой проблемой ИИ со вкусом клубники и кодовым названием o1 "Проект Клубника". Если нет, то это странное совпадение.

Шаг за шагом в решении проблем

Способность модели o1 "рассуждать", решая проблемы, представляет собой прогресс в области искусственного интеллекта, который может оказаться весьма революционным, если его работа будет доказана в реальных условиях.

Новые модели уже показали высокие результаты в таких тестах, как American Invitational Mathematics Examination (AIME).

По данным OpenAI, новая модель решила 83% задач, представленных в AIME, по сравнению со всего 12% у GPT-4o.

Хотя сильные стороны o1 очевидны, у него есть и недостатки.

Модель требует больше времени для получения ответов из-за более продуманной методологии. Время покажет, насколько сильно это повлияет на общее удобство использования.

Странное происхождение o1

o1 появился на фоне разговоров о проекте OpenAI. под кодовым названием "Клубника". который появился в конце 2023 года.

Изначально ходили слухи, что это модель ИИ, способная автономно исследовать веб-страницы и предназначенная для проведения "глубоких исследований".

Разговоры вокруг Strawberry усилились не так давно, когда в The Information просочилась информация о внутренних проектах OpenAI. А именно, OpenAI якобы разрабатывает две формы Strawberry.

Одна из них - это уменьшенная, упрощенная версия, предназначенная для интеграции в ChatGPT. Она призвана расширить возможности рассуждений в сценариях, где пользователям требуются более вдумчивые, подробные ответы, а не быстрые. Похоже, это может быть o1.
Другая, более крупная и мощная версия используется для создания высококачественных "синтетических" обучающих данных для следующей флагманской языковой модели OpenAI под кодовым названием "Орион". Она может быть связана с o1, а может и не быть.

OpenAI не предоставила прямых разъяснений по поводу того, чем на самом деле является Strawberry. Однако многие считают, что o1 - это Strawberry.

Дополнение, а не замена

Мурати подчеркнул, что o1 разработан не для замены GPT-4o, а для его дополнения.

"Есть две парадигмы, - говорит она. "Парадигма масштабирования и эта новая парадигма. Мы ожидаем, что объединим их".

Пока OpenAI продолжает разрабатывать GPT-5, который, вероятно, будет еще больше и мощнее, чем GPT-4o, будущие модели могут включать в себя функции рассуждения из o1.

Такое объединение может решить проблемы, связанные с постоянными ограничениями больших языковых моделей (LLM), например, их неспособностью решать, казалось бы, простые задачи, требующие логического вывода, например, вышеупомянутую задачу о клубнике.

Компании Anthropic и Google, как утверждается, стремятся внедрить в свои модели аналогичные функции. Например, проект AlphaProof от Google также сочетает языковые модели с обучением с подкреплением для решения сложных математических задач.

Однако Чен считает, что у OpenAI есть преимущество. "Я думаю, что нам удалось добиться некоторых успехов в этой области, - сказал он, - Я думаю, что это часть нашего преимущества. На самом деле она довольно хороша в рассуждениях во всех областях".

Йошуа Бенгио, ведущий исследователь в области ИИ и лауреат престижной премии Тьюринга, приветствует прогресс, но призывает к осторожности.

"Если бы системы ИИ демонстрировали подлинное мышление, это позволило бы обеспечить последовательность фактов, аргументов и выводов, сделанных ИИ". сказал он в интервью FT.

Безопасность и этические соображения

В рамках своей приверженности ответственному ИИ OpenAI укрепила функции безопасности o1, включая инструменты безопасности контента "по умолчанию".

Эти инструменты помогают предотвратить получение моделью вредных или небезопасных результатов.

"Мы рады сообщить, что щиты Prompt Shields и защищенные материалы для текста стали общедоступными в службе Azure OpenAI, - говорится в сообщении OpenAI. Сообщение в блоге Microsoft.

Серия o1 доступна для раннего доступа в Azure AI Studio и GitHub Models от Microsoft, а более широкий релиз запланирован на ближайшее время.

OpenAI надеется, что o1 позволит разработчикам и предприятиям внедрять инновации с меньшими затратами, что согласуется с их более широкой миссией - сделать ИИ более доступным для корпоративных пользователей.

"Мы считаем, что это позволит нам дешевле поставлять интеллектуальные системы", - заключил Чен. "И я думаю, что это действительно основная миссия нашей компании".

В целом, это захватывающий релиз. Будет очень интересно посмотреть, над какими вопросами, проблемами и задачами будет работать o1.

OpenAI представляет серию "o1", расширяющую границы разумного ИИ

Как получить доступ к o1

Шаг за шагом в решении проблем

Странное происхождение o1

Дополнение, а не замена

Безопасность и этические соображения

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

AI May Soon Help You Understand What Your Pet Is Trying to Say

Netflix Adds ChatGPT-Powered AI to Stop You From Scrolling Forever

New Skechers AI Store Assistant Rates Outfit and Suggests What to Buy

Ferrari Just Launched an AI App That Lets Fans Experience F1 Like Never Before

OpenAI представляет серию "o1", расширяющую границы разумного ИИ

Как получить доступ к o1

Шаг за шагом в решении проблем

Странное происхождение o1

Дополнение, а не замена

Безопасность и этические соображения

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

AI May Soon Help You Understand What Your Pet Is Trying to Say

Netflix Adds ChatGPT-Powered AI to Stop You From Scrolling Forever

New Skechers AI Store Assistant Rates Outfit and Suggests What to Buy

Ferrari Just Launched an AI App That Lets Fans Experience F1 Like Never Before

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDFБудьте впереди с DailyAI

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI