Salesforce sfida le tendenze dell'intelligenza artificiale con i piccoli ma potenti modelli xLAM-1B e 7B

7 luglio 2024

  • Salesforce ha presentato due modelli compatti di AI progettati per le chiamate di funzione
  • Sono disponibili in forme da 1 e 7 miliardi di parametri, che superano modelli molto più grandi.
  • Il modello da 7 miliardi batte il GPT-4 sui compiti di chiamata di funzioni, che ha trilioni di parametri

Salesforce, un'azienda di software aziendale, ha presentato due modelli compatti di intelligenza artificiale che sfidano il paradigma "più grande è meglio" nell'IA. 

Nonostante le dimensioni compatte, i modelli xLAM a 1 e 7 miliardi di parametri hanno prestazioni superiori a molti modelli più grandi in compiti di chiamata di funzioni.

Questi compiti prevedono che un sistema di intelligenza artificiale interpreti e traduca una richiesta in linguaggio naturale in specifiche chiamate di funzione o richieste API. 

Ad esempio, se si chiede a un sistema di intelligenza artificiale di "trovare voli per New York per il prossimo fine settimana al di sotto di $500", il modello deve comprendere questa richiesta, identificare le funzioni pertinenti (ad esempio, search_flights, filter_by_price) ed eseguirle con i parametri corretti.

"Dimostriamo che i modelli addestrati con i nostri set di dati curati, anche con soli 7B parametri, possono raggiungere prestazioni all'avanguardia nel Berkeley Function-Calling Benchmark, superando più modelli GPT-4", scrivono i ricercatori nel loro articolo. 

"Inoltre, il nostro modello 1B raggiunge prestazioni eccezionali, superando GPT-3.5-Turbo e Claude-3 Haiku".

Il Benchmark per la chiamata di funzioni di Berkeley, a cui si fa riferimento nello studio, è un framework di valutazione progettato per valutare le capacità di chiamata di funzione dei modelli di IA. 

Statistiche chiave del studio includono:

  1. Il modello xLAM-7B (7 miliardi di parametri) si è classificato al sesto posto nella classifica delle funzioni di Berkeley, superando GPT-4 e Gemini-1.5-Pro.
  2. Il modello più piccolo xLAM-1B ha superato modelli più grandi come Claude-3 Haiku e GPT-3.5-Turbo, dimostrando un'efficienza eccezionale.

A rendere particolarmente impressionante questo risultato sono le dimensioni del modello rispetto alla concorrenza:

  • xLAM-1B: 1 miliardo di parametri
  • xLAM-7B: 7 miliardi di parametri
  • GPT-3: 175 miliardi di parametri
  • GPT-4: Stima di 1,7 trilioni di parametri
  • Claude-3 Opus: Non è stato rivelato, ma probabilmente si tratta di centinaia di miliardi.
  • Gemelli Ultra: Non rivelato, stimato simile al GPT-4

Questo dimostra che una progettazione efficiente e dati di addestramento di alta qualità possono essere più importanti delle dimensioni. 

Per addestrare il modello specificamente per il richiamo di funzioni, il team di Salesforce ha sviluppato APIGen, una pipeline per la creazione di set di dati diversificati e di alta qualità per le attività di richiamo di funzioni. 

APIGen funziona campionando da una vasta libreria di 3.673 API eseguibili in 21 categorie, creando scenari realistici da cui l'IA può imparare.

Le potenziali applicazioni delle capacità di xLAM-1B includono il miglioramento dei sistemi di gestione delle relazioni con i clienti (CRM), sviluppati da Salesforce, assistenti digitali più capaci, interfacce migliorate per i dispositivi domestici intelligenti, un'efficiente elaborazione dell'intelligenza artificiale per i veicoli autonomi e la traduzione linguistica in tempo reale sui dispositivi edge.

Questi modelli xLAM sfidano i ricercatori a ripensare l'architettura dell'IA e gli approcci all'addestramento, dimostrando che modelli più piccoli ed efficienti possono competere con quelli più grandi.

Come ha spiegato Marc Benioff, CEO di Salesforce, Tiny Giant mette in luce il potenziale dell'"intelligenza artificiale on-device", perfetta per gli smartphone e i dispositivi IoT.

Il futuro dell'intelligenza artificiale non sarà solo quello di modelli sempre più grandi, ma anche di modelli più intelligenti ed efficienti, in grado di offrire funzionalità avanzate a una gamma più ampia di dispositivi e applicazioni.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Sam Jeans

Sam è uno scrittore di scienza e tecnologia che ha lavorato in diverse startup di intelligenza artificiale. Quando non scrive, lo si può trovare a leggere riviste mediche o a scavare tra scatole di dischi in vinile.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni