Alles wat je moet weten over het nieuwe vlaggenschipmodel van OpenAI, GPT-4o

13 mei 2024

  • OpenAI kondigde zijn nieuwe multimodale vlaggenschipmodel GPT-4o aan.
  • De O staat voor "omni" en geeft de uitstekende audiovisuele prestaties van dit model aan.
  • GPT-4o kan een indrukwekkende real-time spraakvertaling uitvoeren
OpenAI

OpenAI heeft zojuist zijn nieuwe topmodel gedemonstreerd, GPT-4o, met ongelooflijke spraakherkenning en vertaalmogelijkheden. 

Als CEO Sam Altman zelf verklaarde, wisten we OpenAIDe laatste "voorjaarsupdate" had niets te maken met GPT-5 of AI-zoeken.

Maar vandaag om 10 uur 's ochtends namen honderdduizenden deel aan de livestream-presentatie van het nieuwe model, toen Chief Technology Officer (CTO) Mira Murati de voordelen liet zien ten opzichte van zijn voorganger GPT-4.

De belangrijkste aankondigingen tijdens de demosessie zijn

  • GPT-4o (de o staat voor omni) is van plan GPT-4 te vervangen, met OpenAI noemt het zijn nieuwe topmodel. 
  • Hoewel in grote lijnen vergelijkbaar met GPT-4, GPT-4o biedt superieure meertalige en audiovisuele verwerking. Het kan audio in bijna real-time verwerken en vertalen. Latere tests toonden aan dat GPT-4o slechter is dan GPT-4 op sommige 'moeilijke taken'.
  • OpenAI maakt GPT-4o vrij beschikbaar, met beperkingen. Pro-gebruikers krijgen nog steeds voorrang en een hogere berichtenlimiet.
  • OpenAI brengt ook een desktopversie uit van ChatGPTin eerste instantie alleen voor Mac, die onmiddellijk wordt uitgerold.
  • Aangepaste GPT's worden ook toegankelijk voor gratis gebruikers.
  • GPT-4o en de spraakfuncties zullen de komende weken en maanden langzaam worden uitgerold.

GPT-4orealtime audiovertaling

De kop die iedereen aan het praten heeft gekregen is de indrukwekkende audioverwerking en -vertaling van GPT-4o, die in bijna realtime werken. 

Demonstraties lieten zien dat de AI opmerkelijk natuurlijke spraakgesprekken voerde, onmiddellijke vertalingen gaf, verhalen vertelde en coderingsadvies gaf. 

Het model kan bijvoorbeeld een afbeelding van een menu in een vreemde taal analyseren, vertalen en culturele inzichten en aanbevelingen geven. 

Het kan ook emoties herkennen aan ademhaling, uitdrukkingen en andere visuele signalen. 

GPT-4o's emotionele herkenningsvaardigheden zullen waarschijnlijk controverse veroorzaken als het stof eenmaal is neergedaald.

Emotioneel cognitieve AI zou zich kunnen ontwikkelen tot potentieel snode gebruikssituaties die vertrouwen op menselijke nabootsing, zoals deep fakes, social engineering, enz. 

Een andere indrukwekkende vaardigheid die het team heeft gedemonstreerd is realtime codeerhulp via spraak.

Tijdens een demo zongen zelfs twee exemplaren van het model voor elkaar.

De algemene strekking van OpenAIis dat het bedrijf ernaar streeft om AI multimodaliteit echt bruikbaar te maken in alledaagse scenario's, en daarbij tools als Google Translate uitdaagt. 

Een ander belangrijk punt is dat deze demo's levensecht zijn. OpenAI zei: "Alle video's op deze pagina zijn 1x realtime," mogelijk verwijzend naar Google, die zijn Gemini demonstratievideo om zijn multimodale vaardigheden te overdrijven.

Met GPT-4o kunnen multimodale AI-toepassingen veranderen van een nieuwigheid die diep begraven ligt in AI-interfaces in iets waar gemiddelde gebruikers dagelijks mee kunnen werken.

Hoewel de demo indrukwekkend was, is het nog steeds een demo en de resultaten van gemiddelde gebruikers "in het wild" zullen echt onthullen hoe competent deze functies zijn.

Naast real-time spraakverwerking en vertaling, die volop in de schijnwerpers staan, is het feit dat OpenAI is om dit nieuwe model vrij van beperkingen te maken, is enorm. 

WHoewel GPT-4o *gewoon* een iets betere GPT-4 is, zal het iedereen uitrusten met een AI-model van topkwaliteit, waardoor het speelveld voor miljoenen wereldwijd gelijk wordt getrokken.

Je kunt de aankondiging en demo hieronder bekijken:

Alles wat we weten over GPT-4o

Hier is een overzicht van alles wat we tot nu toe weten over GPT-4o:

  • Multimodale integratie: GPT-4o verwerkt en genereert snel tekst-, audio- en beeldgegevens en maakt dynamische interacties in verschillende formaten mogelijk. 
  • Realtime reacties: Het model heeft indrukwekkende reactietijden, vergelijkbaar met menselijke reactiesnelheden tijdens gesprekken, met audiorespons vanaf slechts 232 milliseconden.
  • Taal- en codeercapaciteiten: GPT-4o evenaart de prestaties van GPT-4 Turbo in Engelse en codeertaken en overtreft deze in niet-Engelse tekstverwerking.
  • Audiovisuele verbeteringen: Vergeleken met vorige modellen heeft de GPT-4o een superieur inzicht in beeld- en geluidstaken, waardoor de interactie met multimedia-inhoud wordt verbeterd.
  • Natuurlijke interacties: Demonstraties waren onder andere twee GPT-4o's die een liedje zongen, hielpen bij het voorbereiden van een sollicitatiegesprek, spelletjes speelden zoals steen-papier-schaar en zelfs humor maakten met vadergrappen.
  • Lagere kosten voor ontwikkelaars: OpenAI heeft de kosten voor ontwikkelaars die GPT-4o gebruiken met 50% verlaagd en de verwerkingssnelheid verdubbeld.
  • Prestatie benchmark: GPT-4o benchmarks blinkt uit in meertalige, audio- en visuele taken, hoewel onafhankelijke tests bevestigen dat het achterblijft bij GPT-4 op het gebied van codering, wiskunde en andere 'moeilijke taken'. 

GPT-4o is een belangrijke aankondiging voor OpenAI, particularly as its the most powerful free closed model available by a sizeable margin.

Het zou een tijdperk kunnen inluiden van praktische, nuttige AI-multimodaliteit waar mensen massaal mee aan de slag gaan.

Dat zou een enorme mijlpaal zijn voor zowel het bedrijf als de generatieve AI-industrie als geheel.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Sam Jeans

Sam is een wetenschap- en technologieschrijver die bij verschillende AI-startups heeft gewerkt. Als hij niet aan het schrijven is, leest hij medische tijdschriften of graaft hij door dozen met vinylplaten.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden