Meta, UCSD представляют ToolVerifier для улучшения вызовов инструментов LLM

28 февраля 2024 года

Исследователи из Meta и Калифорнийского университета в Сан-Диего (UCSD) разработали ToolVerifier, метод, который улучшает то, как LLM вызывают и взаимодействуют с программными инструментами.

Для того чтобы магистранты стали полезными в качестве ассистентов или агентыИх нужно научить пользоваться различными инструментами или API. Тонкая настройка LLM на использование конкретного инструмента действительно работает, но реальная задача состоит в том, чтобы LLM мог взаимодействовать с новыми инструментами без необходимости тонкой настройки или демонстрации нескольких кадров.

Когда два инструмента очень похожи, LLM может быть особенно сложно выбрать правильный инструмент для достижения своей цели. Текущий метод предоставления нескольких примеров с несколькими снимками для каждого инструмента может занимать большую часть контекстного окна, доступного LLM.

ToolVerifier - это метод самопроверки, который позволяет LLM задавать себе вопросы, чтобы определить, какой инструмент использовать и какие параметры ему передавать.

Чтобы помочь LLM, ToolVerifier сначала выбирает наиболее подходящий инструмент из библиотеки вариантов, а затем генерирует соответствующие параметры. На каждом из этих этапов он генерирует вопросы, чтобы помочь оценить свой выбор и отличить похожие инструменты-кандидаты.

Вот пример из исследовательской работы, показывающий процесс выбора инструмента и уточнения параметров.

ToolVerifier сначала определяет два лучших инструмента и генерирует проверочный вопрос. Ответ на вопрос приводит к окончательному выбору инструмента. Аналогичный метод используется для генерации параметров. Источник: arXiv

ToolVerifier был обучен на данных, состоящих из списка синтетических инструментов, включая инструменты для путешествий, банковских операций и календаря, а также их описания. Он был обучен выбирать подходящий инструмент, основываясь исключительно на названии и описании.

После обучения выбору инструментов и проверке параметров исследователи протестировали ToolVerifier на 4 задачах из бенчмарка ToolBench, в которых Llama 2-70B должна была взаимодействовать с 17 ранее невиданными инструментами.

Результаты опубликовано в газете утверждают, что использование метода ToolVerifier привело к "среднему улучшению на 22% по сравнению с базовыми значениями в несколько выстрелов, даже в сценариях, где различия между инструментами-кандидатами очень тонкие".

Процентное соотношение (%) успешности выполнения задач Weather, Booking, Home и Cat из бенчмарка Toolbench при сравнении моделей с ToolVerifier и без него. Источник: arXiv

Результаты показывают, что ToolVerifier обеспечивает существенное улучшение выбора инструментов LLM и точную генерацию параметров. Метод был обучен и протестирован только для взаимодействия одного, а не нескольких инструментов, но, тем не менее, он многообещающий.

ЛЛМ с инструментальным дополнением - это захватывающее развитие в использовании ИИ в качестве обобщенного агента. Когда LLM научатся использовать несколько инструментов для достижения цели, они станут еще более полезными для нас, чем сейчас.

Будущее, в котором помощник с искусственным интеллектом будет бронировать билеты на самолет, координировать встречу или делать покупки за вас, кажется не таким уж далеким.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Юджин ван дер Ватт

Юджин - выходец из электронной инженерии и обожает все, что связано с техникой. Когда он отдыхает от чтения новостей об искусственном интеллекте, вы можете найти его за столом для игры в снукер.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения