Meta och UCSD introducerar ToolVerifier för att förbättra LLM-verktygsanrop

28 februari 2024

Forskare från Meta och University of California San Diego (UCSD) utvecklade ToolVerifier, en metod som förbättrar hur LLM:er anropar och interagerar med programvaruverktyg.

För att LLM ska bli användbara som allmänna assistenter eller agentermåste de lära sig hur man använder olika verktyg eller API:er. Att finjustera en LLM för att använda ett specifikt verktyg fungerar, men den verkliga utmaningen är att en LLM ska interagera med nya verktyg utan behov av finjustering eller få demonstrationer.

När två verktyg är mycket lika kan det vara särskilt utmanande för LLM att välja rätt verktyg för att uppnå sitt mål. Den nuvarande metoden att ge flera exempel med få bilder för varje verktyg kan också ta mycket av det kontextfönster som är tillgängligt för en LLM.

ToolVerifier är en självverifieringsmetod som gör det möjligt för LLM att ställa frågor till sig själv så att den kan räkna ut vilket verktyg som ska användas och vilka parametrar som ska skickas till verktyget.

För att hjälpa LLM väljer ToolVerifier först ut det lämpligaste verktyget från ett bibliotek med alternativ och genererar sedan lämpliga parametrar. I vart och ett av dessa steg genereras frågor som hjälper till att utvärdera valet och skilja mellan liknande kandidatverktyg.

Här är ett exempel från forskningsrapporten som visar processen med verktygsval och parameterförtydligande.

ToolVerifier identifierar först de två bästa verktygen och genererar en verifieringsfråga. Svaret på frågan leder till det slutliga valet av verktyg. En liknande metod används för att generera parametrar. Källa: arXiv

ToolVerifier tränades på data som bestod av en lista med syntetiska verktyg, bland annat rese-, bank- och kalenderverktyg med tillhörande beskrivningar. Den tränades i att välja rätt verktyg enbart baserat på titeln och beskrivningen.

Efter att ha tränats i verktygsval och parameterverifiering testade forskarna ToolVerifier med fyra uppgifter från ToolBench-riktmärket som krävde att Llama 2-70B interagerade med 17 tidigare okända verktyg.

Resultaten publicerad i tidningen säger att användningen av ToolVerifier-metoden resulterade i "en genomsnittlig förbättring på 22% jämfört med baslinjer med få bilder, även i scenarier där skillnaderna mellan kandidatverktyg är fin nyanserade."

Procentuell (%) framgångsgrad för uppgifterna Weather, Booking, Home och Cat från Toolbench-riktmärket som jämför modeller med och utan ToolVerifier. Källa: arXiv

Resultaten visar att ToolVerifier ger en avsevärd förbättring av LLM:s verktygsval och korrekta parametergenerering. Metoden utbildades och testades endast för interaktioner med ett verktyg snarare än flera, men det är ändå lovande.

Verktygsförstärkta LLM:er är en spännande utveckling när det gäller att använda AI som en generaliserad agent. När LLM:er lär sig att använda flera verktyg för att uppnå ett mål kommer de att vara ännu mer användbara för oss än de redan är.

Framtiden där en AI-assistent bokar ett flyg, samordnar ett möte eller gör dina matinköp åt dig verkar inte vara långt borta.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar