Почему в мире ИИ все говорят о клубнике?

28 августа 2024 года

  • OpenAI якобы работает над секретным проектом под кодовым названием "Клубника"
  • Он может быть связан с проектом Q*, о котором впервые заговорили в ноябре 2023 года.
  • О Клубнике известно немного, хотя она может быть/стать частью GPT-5

В OpenAI снова наступило затишье, а столь разрекламированные функции голосового чата GPT-4o разворачиваются гораздо медленнее, чем кто-либо ожидал. 

Но уже появились слухи о новых проектах, включая SearchGPT, который сочетает в себе генеративный ИИ и веб-браузинг, и более загадочный "Проект Клубника".

История Strawberry берет свое начало в ноябре 2023 года, когда модель (скорее, техника обучения) под названием Q* появилась в Утечки из агентства Рейтер.

Высказывались даже предположения, что Q* потенциально опасен и сыграл определенную роль в найме и увольнении генерального директора Сэма Альтмана в прошлом году. 

Предполагалось, что Q* будет сочетать в себе продвинутую модель рассуждений с агентом ИИ, способным исследовать интернет.

Несмотря на драматичные заголовки: "OpenAI сидит на апокалиптически мощной модели", ее легитимность в то время очень сильно оспаривалась. 

Более подробная информация о проекте Q* появилась в мае и июне этого года, после чего он был переименован в Project Strawberry или просто Strawberry. По данным агентства ReutersStrawberry - это специализированный метод обучения моделей искусственного интеллекта для автономного изучения интернета и проведения "глубоких исследований".

Q, скорее всего, относится к Q-learning, давно известной технике обучения с подкреплением (RL). Что касается звезды (*), то здесь больше неопределенности. Агентство Reuters утверждает, что он похож на метод, разработанный в Стэнфорде под названием "Self-Taught Reasoner" или "STaR". Другие утверждают, что он связан с поисковым алгоритмом под названием A*.

Источники сообщили, что OpenAI хочет, чтобы модель проводила исследования, автономно просматривая веб-страницы с помощью "агента, использующего компьютер" (CUA), который также является ключевым компонентом SearchGPT.

Согласно этим источникам, OpenAI хочет, чтобы Strawberry выполняла "долгосрочные задачи" (long-horizon tasks, LHT), которые предполагают сложное планирование и выполнение в течение длительного времени. 

Профессор Стэнфорда Ной Гудман, один из создателей STaR, рассказал Reuters об этой технологии, "Я думаю, что это одновременно и волнительно, и страшно... Если все будет развиваться в этом направлении, нам, как людям, придется серьезно задуматься".

Отвечая на вопрос о Strawberry, представитель OpenAI сделал общее заявление о целях компании по развитию ИИ:

"Мы хотим, чтобы наши модели ИИ видели и понимали мир так же, как мы сами. Непрерывные исследования новых возможностей ИИ - обычная практика в отрасли, и мы верим, что со временем эти системы станут более разумными".

Социальные сети перемешивают

Вскоре после сообщения Reuters, в начале августа, Альтман опубликовал фотографию клубники, сопроводив ее подписью "Я люблю лето в саду", что вновь породило спекуляции о проекте Strawberry.

Затем пользователь iruletheworldmo, своего рода мемы/сатирический аккаунт, ориентированный на ИИ (с фотографией Теодора Твомбли, которого играет Хоакин Феникс, из фильма "Она", который стал ассоциироваться с Альтманом), начал публиковать материалы, связанные с клубникой, намекая на потенциальный прорыв "второго уровня" в ИИ.

Пользователь написал: "Добро пожаловать на второй уровень. Как вы себя чувствуете? Я заставил вас чувствовать себя лучше?". Альтман, генеральный директор OpenAI, ответил: "Потрясающе, если честно".

Этот обмен вызвал цепную реакцию постов на клубничную тему и массовые спекуляции на X и Reddit. 

Клубника принимает другой оборот

Совсем недавно, Информация раскрыта что OpenAI готовится запустить версию Strawberry в составе чат-бота и, возможно, интегрировать ее в ChatGPT уже этой осенью. 

OpenAI также якобы продемонстрировала возможности Strawberry сотрудникам национальной безопасности США.

Интересно, что, по данным The Information, OpenAI разрабатывает две разные версии Strawberry:

  1. Эта уменьшенная, упрощенная версия предназначена для интеграции в приложения, основанные на чате, такие как ChatGPT. Она призвана расширить возможности рассуждений в сценариях, где пользователям требуются более вдумчивые, подробные ответы, а не быстрые ответы.
  2. Эта более крупная и мощная версия используется для создания высококачественных "синтетических" обучающих данных для следующей флагманской языковой модели OpenAI под кодовым названием "Орион".

Синтетические данные, генерируемые Strawberry, могут уменьшить зависимость от текстов и изображений из Интернета при обучении.

Это может привести к созданию более точных и надежных моделей ИИ, что позволит решить такие постоянные проблемы, как "галлюцинации" ИИ или разрушение модели

Однако, как ни странно, эти характеристики Клубнички не очень хорошо согласуются с предыдущими описаниями Q*.

Возможно, мы могли бы предположить, что Strawberry, автономный агент, автономно просматривает веб-страницы и использует свои "глубокие исследования", чтобы в конечном итоге синтезировать данные.

Может быть, это более эффективно с вычислительной точки зрения и полезно для обучения модели, чем простое соскабливание сырых данных?

ИИ не знает, сколько букв "Р" в клубнике.

И вот тут-то история принимает причудливый и ироничный оборот. 

Клубника может быть названа в честь слова, которое современные модели ИИ, включая самые продвинутые, часто не могут правильно написать. 

Спросите ИИ, сколько букв "р" в слове "клубника", и есть вероятность, что он уверенно ответит "два" вместо правильного "три".

Звучит нелепо, правда? Я и сама не верила, пока не попробовала это с Клодом. 

Клубника

Когда об этом впервые стало известно, некоторые утверждали, что это своего рода "пасхальное яйцо" или шутка в системе OpenAI.

Но поскольку Клод реагирует так же, как и ChatGPT, то, если только AI-компании не сговорились о нишевых клубничных шутках за кулисами, это кажется маловероятным. 

Объяснение этому элегантно в своей простоте.

Языковые модели, несмотря на название, - это математические системы. Они не могут "по-настоящему" понимать слова. Текст переводится в код, что чревато потерей контекста и смысла на уровне слов.

Почему клубника достоверно вызывает этот недостаток - вопрос более загадочный. 

В любом случае, выбрала ли OpenAI название "Клубника" в качестве игривого кивка на этот распространенный камень преткновения ИИ или по чистой случайности, остается неясным. Это похоже на то, что мог бы сделать Олтман, независимо от того, существует ли Клубничка на самом деле или нет. 

Что будет дальше в этой странной, но ягодно-интересной (...) клубничной истории, остается только догадываться. Честно говоря, на данном этапе у меня складывается ощущение, что ни одно из спекулятивных "доказательств", которые мы имеем от крупных новостных изданий, не отражает в полной мере того, что происходит в OpenAI.

Нам придется подождать SearchGPT и/или GPT-5, чтобы увидеть, насколько развитыми станут продукты OpenAI на базе Strawberry и других их проектов.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения