Salesforce daagt trends in AI uit met de kleine maar machtige xLAM-1B en 7B modellen

7 juli 2024

  • Salesforce onthult twee compacte AI-modellen die zijn ontworpen voor function-calling
  • Ze zijn er in 1- en 7-miljard parametervormen en presteren beter dan veel grotere modellen
  • Het 7-miljard model verslaat GPT-4 op taken voor het oproepen van functies, dat triljoenen parameters heeft

Salesforce, een bedrijf voor bedrijfssoftware, heeft twee compacte AI-modellen onthuld die het "groter is beter"-paradigma in AI uitdagen. 

Ondanks hun compacte formaat presteren de xLAM-modellen met 1 en 7 miljard parameters beter dan veel grotere modellen in functie-oproeptaken.

Deze taken houden in dat een AI-systeem een verzoek in natuurlijke taal interpreteert en vertaalt in specifieke functieaanroepen of API-verzoeken. 

Als je een AI-systeem bijvoorbeeld vraagt om "vluchten naar New York te vinden voor volgend weekend onder $500", dan moet het model dit verzoek begrijpen, de relevante functies identificeren (bijv. zoeken_vluchten, filteren_op_prijs) en ze uitvoeren met de juiste parameters.

"We tonen aan dat modellen die zijn getraind met onze gecureerde datasets, zelfs met slechts 7B parameters, state-of-the-art prestaties kunnen behalen op de Berkeley Function-Calling Benchmark, waarbij ze meerdere GPT-4 modellen overtreffen," schrijven de onderzoekers in hun paper. 

"Bovendien levert ons 1B-model uitzonderlijke prestaties en overtreft het GPT-3.5-Turbo en Claude-3 Haiku."

De Berkeley functie-aanroep benchmarkwaarnaar in het onderzoek wordt verwezen, is een evaluatieraamwerk dat is ontworpen om de functie-oproepcapaciteiten van AI-modellen te beoordelen. 

Belangrijkste statistieken van de studie omvatten:

  1. Het xLAM-7B model (7 miljard parameters) staat op de 6e plaats van de Berkeley Function-Calling Leaderboard en presteert beter dan GPT-4 en Gemini-1.5-Pro.
  2. Het kleinere xLAM-1B model presteerde beter dan grotere modellen zoals Claude-3 Haiku en GPT-3.5-Turbo en toonde een uitzonderlijke efficiëntie.

Wat deze prestatie bijzonder indrukwekkend maakt, is de grootte van het model in vergelijking met zijn concurrenten:

  • xLAM-1B: 1 miljard parameters
  • xLAM-7B7 miljard parameters
  • GPT-3: 175 miljard parameters
  • GPT-4: Geschatte 1,7 biljoen parameters
  • Claude-3 Opus: Niet bekend, maar waarschijnlijk honderden miljarden
  • Gemini Ultra: Onbekend, geschat vergelijkbaar met GPT-4

Dit toont aan dat een efficiënt ontwerp en hoogwaardige trainingsgegevens belangrijker kunnen zijn dan alleen de grootte. 

Om het model specifiek voor function-calling te trainen, ontwikkelde het Salesforce-team APIGen, een pijplijn voor het maken van diverse datasets van hoge kwaliteit voor function-calling-taken. 

APIGen werkt door te putten uit een enorme bibliotheek van 3673 uitvoerbare API's in 21 categorieën, waardoor de AI realistische scenario's creëert om van te leren.

Potentiële toepassingen van de mogelijkheden van xLAM-1B zijn onder andere verbeterde CRM-systemen (Customer Relationship Management) die Salesforce ontwikkelt, meer capabele digitale assistenten, verbeterde interfaces voor slimme thuisapparaten, efficiënte AI-verwerking voor autonome voertuigen en real-time taalvertaling op randapparaten.

Deze xLAM-modellen dagen onderzoekers uit om opnieuw na te denken over hun AI-architectuur en trainingsbenaderingen door aan te tonen dat kleinere, efficiëntere modellen kunnen concurreren met grotere modellen.

Zoals Marc Benioff, CEO van Salesforce, uitlegde, benadrukt Tiny Giant het potentieel voor "on-device agentic AI", perfect voor smartphones en IoT-apparaten.

De toekomst van AI zal niet alleen bestaan uit steeds grotere modellen, maar ook uit slimmere, efficiëntere modellen die geavanceerde functies kunnen bieden voor een breder scala aan apparaten en toepassingen.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden