OpenAI заявляет, что GPT-3.5 Turbo доступен для тонкой настройки

24 августа 2023 года

OpenAI GPT

Компания OpenAI объявила о том, что разработчики теперь могут точно настраивать модель GPT-3.5 Turbo, используя пользовательские данные.

Тонкая настройка - это процесс взятия базовой версии модели, такой как GPT-3.5 Turbo, лежащей в основе ChatGPT, и обучения ее на очень специфическом наборе данных. 

Базовая модель GPT-3.5 Turbo умеет делать множество разных вещей. Если разработчик настраивает ее на наборе данных, ориентированном на конкретный случай использования, она становится действительно хорошей для выполнения очень специфического набора задач. Это все равно что взять обычного разнорабочего и обучить его быть действительно хорошим сантехником.

Теперь компании могут обучить версию ChatGPT с помощью GPT-3.5 Turbo так, чтобы она выдавала результаты, адаптированные к их бизнесу.

Например, компания может захотеть, чтобы все ответы ChatGPT были на определенном языке или постоянно выдавали короткие или длинные ответы. Ответы также можно обучить всегда выводить в определенном формате или соблюдать единый тон корпоративного общения.

Если вы хотите использовать ChatGPT для последовательного выполнения определенного типа завершения кода или просто сосредоточиться на составлении вызовов API, теперь вы можете обучить его этому с помощью GPT-3.5 Turbo.

До сих пор разработчики могли лишь тонко настраивать менее производительные устаревшие варианты GPT-3. Использование усовершенствованной версии GPT-3.5 Turbo обеспечивает гораздо более высокую производительность.

В своем сообщении OpenAI заявила, что "ранние тесты показали, что доработанная версия GPT-3.5 Turbo может соответствовать или даже превосходить базовые возможности уровня GPT-4 в некоторых узких задачах".

GPT-3.5 Turbo имеет контекстное окно с 4k токенами, что в два раза больше, чем у предыдущих моделей с возможностью тонкой настройки. 16-килобайтная версия модели будет доступна для тонкой настройки позднее в этом году.

Это не бесплатно, но становится все дешевле

OpenAI по-прежнему взимает плату за API-вызовы к своим моделям, но возможность точной настройки модели может снизить общие расходы на ее эксплуатацию. 

Стоимость использования GPT-3.5 составляет $0.008/1k токенов для обучения, $0.012/1k токенов для использования на входе и $0.016/1k токенов для использования на выходе.

Количество токенов в отправленных вами подсказках и полученных ответах определяет стоимость поездки туда и обратно. Настроив модель, вы можете обучить ее реагировать на сокращенные подсказки. OpenAI утверждает, что некоторые ранние тестеры смогли сократить длину подсказок до 90%.

Такое сокращение количества отправляемых токенов снижает сопутствующие расходы, а также делает вызовы API намного быстрее. Возможность снижения стоимости за счет тонкой настройки очень важна для OpenAI, поскольку она конкурирует с такими бесплатными моделями, как Llama 2. 

Даже если OpenAI взимает плату за вызовы API, эффективность и повышенная производительность могут сделать его эксплуатацию дешевле, чем бесплатные модели с открытым исходным кодом, такие как Llama 2. Бесплатные модели все равно должны где-то работать, а вычисления стоят недешево.

Появление GPT-3.5 Turbo для тонкой настройки также своевременно, учитывая, как Компания Microsoft предпринимает шагидля представления конкурирующих моделей искусственного интеллекта на платформе Azure.

И поскольку корпоративные опасения по поводу безопасности данных ChatGPT не утихают, OpenAI не преминула подтвердить: "Как и во всех наших API, данные, отправляемые в API тонкой настройки, принадлежат клиенту и не используются OpenAI или какой-либо другой организацией для обучения других моделей".

Хватит ли этого, чтобы убедить скептиков, пока неизвестно. Если все сведется к стоимости обработки и производительности, то благодаря этому последнему шагу предложение OpenAI станет более привлекательным, чем даже ведущие бесплатные модели ИИ.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения