Google, OpenAI en Mistral hebben binnen slechts 12 uur nieuwe versies van hun geavanceerde AI-modellen uitgebracht.
Meta gaat ook meedoen met het aankomende Llama 3 model en OpenAI's langverwachte GPT-5 staat op stapel.
Wat begon als een zeer nichecategorie gedomineerd door ChatGPT wordt nu overspoeld met alternatieven die Big Tech en de open en closed-source scheidslijn overstijgen.
Google Gemini Pro 1.5
Google's Gemini Pro 1.5 maakte de eerste sprong voorwaarts en introduceerde verbeteringen in het begrijpen van lange contexten die Claude 3 Opus uitdagen, die de azen heeft in die categorie.
Ons volgende generatie AI-model Gemini 1.5 Pro is nu beschikbaar in openbare preview op @GoogleCloud's #VertexAI platform.
Het lange-contextvenster helpt bedrijven nu al om grote hoeveelheden gegevens te analyseren, AI-gestuurde klantenserviceagenten te bouwen en nog veel meer. → https://t.co/CLMN3wNmeP pic.twitter.com/RpRVUul3eg
- Google DeepMind (@GoogleDeepMind) 9 april 2024
Met de mogelijkheid om tot 1 miljoen tokens te verwerken, kan Gemini Pro 1.5 enorme hoeveelheden informatie tegelijkertijd verwerken, waaronder 700.000 woorden, een uur video of 11 uur audio.
De Mixture-of-Experts (MoE) architectuur verbetert de efficiëntie en prestaties door gebruik te maken van gespecialiseerde modellen voor specifieke taken.
Google's lijst van Gemini modellen is vrij complex, maar dit is hun meest capabele model voor typische taken.
Google laat ontwikkelaars ook dagelijks 50 gratis verzoeken doen aan de API, wat volgens een persoon op X tot $1,400 zou kosten.
Gemini 1.5 Pro is momenteel verkrijgbaar in 180 landen.
Nieuwe versie van GPT-4 Turbo
OpenAI bracht vervolgens een nieuwe versie uit, GPT-4 Turbo, met superieure reken- en beeldverwerking.
Volgens een bericht van X is "GPT-4 Turbo met Vision nu algemeen beschikbaar in de API. Vision-verzoeken kunnen nu ook JSON-modus en functie-aanroepen gebruiken."
GPT-4 Turbo met Vision is nu algemeen beschikbaar in de API. Vision-verzoeken kunnen nu ook JSON-modus en functie-aanroepen gebruiken.https://t.co/cbvJjij3uL
Hieronder staan enkele geweldige manieren waarop ontwikkelaars bouwen met visie. Stuur de jouwe in een reactie 🧵
- OpenAI-ontwikkelaars (@OpenAIDevs) 9 april 2024
OpenAI verwacht GPT -5 binnenkort uit te brengen, net als zijn tekst-naar-videomodel Sora, dat op dit moment geen noemenswaardige concurrenten heeft (maar dat zal veranderen).
Mixtral 8x22B
Maar de grootste verrassing kwam misschien wel van Mistraldie hun Mixtral 8x22B model hebben gepubliceerd als een gratis te downloaden 281GB bestand via torrent.
magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%https://t.co/2UepcMGLGd%3A1337%2Fannounce&tr=http%3A%2F%https://t.co/OdtBUsbeV5%3A1337%2Fannounce
- Mistral AI (@MistralAI) 10 april 2024
Met een indrukwekkende 176 miljard parameters en een contextlengte van 65.000 tokens zal dit open-source model op de Apache 2.0 licentie naar verwachting beter presteren dan Mistral's vorige Mixtral 8x7B model, dat concurrenten zoals Llama 2 70B al in verschillende benchmarks had overtroffen.
De geavanceerde MoE-architectuur van de Mixtral 8x22B zorgt voor efficiënte berekeningen en betere prestaties in vergelijking met vorige iteraties.
Meta Llama 3 komt eraan
Om niet achter te blijven, suggereren rapporten dat Meta volgende week al een kleine versie van het langverwachte Llama 3 model zou kunnen uitbrengen, terwijl het volledige open-source model nog steeds gepland staat voor juli.
Llama 3 wordt verwacht in verschillende groottes, van zeer kleine modellen die concurreren met Claude Haiku of Gemini Nano tot grotere, volledig responsieve en redeneerbare modellen die kunnen wedijveren met GPT-4 of Claude 3 Opus.
Model vermenigvuldiging
Een generatief AI-ecosysteem dat ooit werd gedomineerd door ChatGPT wordt nu overspoeld door alternatieven.
Vrijwel elk groot technologiebedrijf is erbij betrokken, rechtstreeks of via grote investeringen. En met elke speler die zich in de strijd mengt, neemt de hoop af dat één factie de markt zal domineren.
We zien nu ook de kloof kleiner worden tussen closed-source modellen van OpenAI, Anthropic, Google, enz. en closed-source alternatieven van Mistral, Meta en anderen.
Open-source modellen zijn nog steeds vrij ontoegankelijk voor het grote publiek, maar ook dit zal waarschijnlijk veranderen.
Betekent een van deze modellen echte vooruitgang in machinaal leren, of gewoon meer van hetzelfde maar dan beter? Dat hangt af van wie je het vraagt.
Sommigen, zoals Elon Musk, voorspellen dat AI de menselijke intelligentie zal overtreffen binnen een jaar.
Anderen, zoals Meta chief scientist Yann LeCun, beweren dat AI mijlenver achter ons ligt als het gaat om robuuste maatstaven voor intelligentie.
LeCun uitgelegd in februari over de huidige LLM's: "Dus eigenlijk kunnen ze geen nieuwe dingen uitvinden. Ze herkauwen ongeveer alles waar ze op getraind zijn uit openbare gegevens, wat betekent dat je het van Google kunt halen. Mensen hebben gezegd: 'Oh mijn God, we moeten LLM's reguleren omdat ze zo gevaarlijk zullen zijn'. Dat is gewoon niet waar."
Meta wil 'object-gedreven' AI creëren die de wereld beter begrijpt en probeert te plannen en er omheen te redeneren.
"We zijn hard aan het werk om uit te zoeken hoe we deze modellen niet alleen aan het praten krijgen, maar ook aan het redeneren, aan het plannen... om geheugen te hebben," verklaarde Joelle Pineaude vicepresident van AI-onderzoek bij Meta.
De chief operating officer van OpenAI, Brad Lightcap, zei ook dat zijn bedrijf zich richt op het verbeteren van het vermogen van de AI om te redeneren en complexere taken uit te voeren.
"We zullen AI gaan zien die complexere taken op een meer verfijnde manier kan uitvoeren," zei hij tijdens een recent evenement, "Ik denk dat we in de loop van de tijd zullen zien dat de modellen naar langere, complexere taken gaan en dat vereist impliciet een verbetering van hun vermogen om te redeneren."
Terwijl 2024 de zomer nadert, zullen de AI-gemeenschap en de maatschappij in het algemeen nauwlettend in de gaten houden welke baanbrekende ontwikkelingen er uit de laboratoria van deze techgiganten komen.
Tegen het einde van het jaar zal het een kleurrijke selectie zijn.