Meta e UCSD apresentam o ToolVerifier para melhorar as chamadas de ferramentas LLM

28 de fevereiro de 2024

Os investigadores da Meta e da Universidade da Califórnia em San Diego (UCSD) desenvolveram o ToolVerifier, um método que melhora a forma como os LLMs chamam e interagem com as ferramentas de software.

Para que os LLM se tornem úteis como assistentes gerais ou agentesPara isso, é necessário ensiná-los a usar várias ferramentas ou APIs. O ajuste fino de um LLM para usar uma ferramenta específica funciona, mas o verdadeiro desafio é que um LLM interaja com novas ferramentas sem a necessidade de ajustes finos ou de demonstrações pontuais.

Quando duas ferramentas são muito semelhantes, pode ser especialmente difícil para o LLM escolher a ferramenta correcta para atingir o seu objetivo. O método atual de fornecer vários exemplos de poucos disparos para cada ferramenta pode consumir muito da janela de contexto disponível para um LLM também.

O ToolVerifier é um método de auto-verificação que permite ao LLM fazer perguntas a si próprio, de modo a determinar qual a ferramenta a utilizar e quais os parâmetros a passar à ferramenta.

Para ajudar o LLM, o ToolVerifier começa por selecionar a ferramenta mais adequada a partir de uma biblioteca de opções e depois gera os parâmetros apropriados. Em cada uma dessas etapas, ele gera perguntas para ajudar a avaliar suas escolhas e discriminar entre ferramentas candidatas semelhantes.

Eis um exemplo do documento de investigação que mostra o processo de seleção de ferramentas e de clarificação de parâmetros.

O ToolVerifier primeiro identifica as duas principais ferramentas e gera uma pergunta de verificação. A resposta à pergunta leva à escolha final da ferramenta. É utilizado um método semelhante para gerar parâmetros. Fonte: arXiv

O ToolVerifier foi treinado com dados que consistiam numa lista de ferramentas sintéticas, incluindo ferramentas de viagem, bancárias e de calendário e as respectivas descrições. Foi treinado para selecionar a ferramenta adequada com base apenas no título e na descrição.

Uma vez treinado na seleção de ferramentas e na verificação de parâmetros, os investigadores testaram o ToolVerifier com 4 tarefas do benchmark ToolBench que exigiam que a Llama 2-70B interagisse com 17 ferramentas nunca antes vistas.

Os resultados publicado no jornal afirmam que a utilização do método ToolVerifier resultou numa "melhoria média de 22% em relação às linhas de base de poucos disparos, mesmo em cenários em que as distinções entre as ferramentas candidatas são finamente matizadas".

Percentagem (%) da taxa de sucesso das tarefas Weather, Booking, Home e Cat do benchmark Toolbench comparando modelos com e sem ToolVerifier. Fonte: arXiv

Os resultados mostram que o ToolVerifier proporciona uma melhoria substancial na seleção de ferramentas de um LLM e na geração de parâmetros precisos. O método só foi treinado e testado para interacções com uma única ferramenta e não com várias ferramentas, mas é promissor.

Os LLMs com ferramentas aumentadas são um desenvolvimento interessante na utilização da IA como agente generalizado. Quando os LLMs aprenderem a utilizar várias ferramentas para atingir um objetivo, serão ainda mais úteis do que já são.

O futuro em que um assistente de IA reserva um voo, coordena uma reunião ou faz as compras de mercearia por si, não parece muito distante.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Eugene van der Watt

Eugene vem de uma formação em engenharia eletrónica e adora tudo o que é tecnologia. Quando faz uma pausa no consumo de notícias sobre IA, pode encontrá-lo à mesa de snooker.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições