Meta, UCSD introducono ToolVerifier per migliorare le chiamate agli strumenti LLM

28 febbraio 2024

I ricercatori di Meta e dell'Università della California San Diego (UCSD) hanno sviluppato ToolVerifier, un metodo che migliora il modo in cui i LLM chiamano e interagiscono con gli strumenti software.

Per i laureati in Lettere e Filosofia è utile diventare assistenti generici o agentiÈ necessario insegnare loro come utilizzare vari strumenti o API. La messa a punto di un LLM per l'utilizzo di uno strumento specifico funziona, ma la vera sfida è quella di far interagire un LLM con nuovi strumenti senza la necessità di una messa a punto o di poche dimostrazioni.

Quando due strumenti sono molto simili, può essere particolarmente difficile per l'LLM scegliere quello giusto per raggiungere il suo obiettivo. L'attuale metodo di fornire diversi esempi di pochi scatti per ogni strumento può consumare molto della finestra di contesto a disposizione di un LLM.

ToolVerifier è un metodo di autoverifica che consente all'LLM di porsi delle domande per capire quale strumento utilizzare e quali parametri passare allo strumento.

Per aiutare l'LLM, ToolVerifier seleziona prima lo strumento più adatto da una libreria di opzioni e poi genera i parametri appropriati. In ognuna di queste fasi, genera domande che aiutano a valutare le sue scelte e a discriminare tra strumenti candidati simili.

Ecco un esempio tratto dal documento di ricerca che mostra il processo di selezione degli utensili e di chiarificazione dei parametri.

ToolVerifier identifica innanzitutto i due strumenti migliori e genera una domanda di verifica. La risposta alla domanda porta alla scelta finale dello strumento. Un metodo simile viene utilizzato per generare i parametri. Fonte: arXiv

ToolVerifier è stato addestrato su dati costituiti da un elenco di strumenti sintetici, tra cui strumenti di viaggio, bancari e di calendario e le relative descrizioni. È stato addestrato a selezionare lo strumento appropriato sulla base del titolo e della descrizione.

Una volta addestrato alla selezione degli strumenti e alla verifica dei parametri, i ricercatori hanno testato ToolVerifier con 4 compiti del benchmark ToolBench che richiedeva a Llama 2-70B di interagire con 17 strumenti mai visti prima.

I risultati pubblicato sul giornale dicono che l'uso del metodo ToolVerifier ha portato a "un miglioramento medio di 22% rispetto alle linee di base a pochi scatti, anche in scenari in cui le distinzioni tra gli strumenti candidati sono finemente sfumate".

Percentuale di successo (%) per i task Meteo, Prenotazione, Casa e Gatto del benchmark Toolbench, confrontando i modelli con e senza ToolVerifier. Fonte: arXiv

I risultati mostrano che ToolVerifier offre un miglioramento sostanziale nella selezione degli utensili e nella generazione accurata dei parametri di un LLM. Il metodo è stato addestrato e testato solo per interazioni con un singolo utensile piuttosto che con più utensili, ma è comunque promettente.

Gli LLM arricchiti di strumenti sono uno sviluppo entusiasmante nell'utilizzo dell'intelligenza artificiale come agente generalizzato. Quando i LLM impareranno a utilizzare più strumenti per raggiungere un obiettivo, saranno ancora più utili di quanto non lo siano già.

Il futuro in cui un assistente AI prenoterà un volo, coordinerà una riunione o farà la spesa al posto vostro non sembra molto lontano.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Eugene van der Watt

Eugene proviene da un background di ingegneria elettronica e ama tutto ciò che è tecnologico. Quando si prende una pausa dal consumo di notizie sull'intelligenza artificiale, lo si può trovare al tavolo da biliardo.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni