AI-agenten, multimodale Phi-3 onthuld op Microsoft Build 2024

22 mei 2024

  • Microsoft onthulde Team Copilot, een samenwerkingstool voor productiviteit, op de Build Developer Conference
  • Copilot Studio kan AI-agenten maken om functies in applicaties te automatiseren
  • Phi-3 Vision voegt beeld- en audiomodaliteiten toe aan de Phi-3 familie van kleine taalmodellen

Satya Nadella gebruikte zijn keynote op dag 1 van Microsofts Build Developer Conference om een aantal spannende nieuwe AI-ontwikkelingen aan te kondigen die binnenkort algemeen beschikbaar zullen zijn.

Microsoft Build is een jaarlijkse conferentie waar ontwikkelaars de nieuwste ontwikkelingen in Windows 11 en Microsoft 365 te zien krijgen. Op de eerste dag werden enkele interessante generatieve AI-tools onthuld.

Team Copilot

In 2023 bracht Microsoft zijn Copilot chatbot die realtime intelligente hulp biedt terwijl je werkt met Microsoft 365 tools zoals Word, Excel, PowerPoint, Outlook of Teams.

Nadella kondigde aan dat het een aanzienlijke AI-upgrade kreeg met Team Copilot. Team Copilot breidt uit Copilot van een individuele persoonlijke assistent naar een deel van een team, waardoor de samenwerking en het projectbeheer verbeteren.

Als je in een team werkt met Microsoft Teams, Microsoft Loop of Microsoft Planner, is Team Copilot kan vergaderingen faciliteren door de agenda te beheren en notities te maken. Het kan belangrijke informatie markeren, actiepunten bijhouden en onopgeloste problemen aanpakken.

Het kan zelfs fungeren als een projectmanager die taken toewijst, deadlines bijhoudt en teamleden op de hoogte stelt wanneer hun inbreng nodig is.

Aangepaste copiloot-agenten

Microsoft Copilot Met Studio kun je aangepaste copilots bouwen die fungeren als agenten die onafhankelijk werken nadat je ze instructies hebt gegeven.

Met behulp van een natuurlijke taalprompt beschrijf je eenvoudig wat je wilt dat de agent doet en vervolgens zet je hem in op meerdere platforms.

Microsoft zegt dat deze agents kunnen:

  • Langlopende bedrijfsprocessen automatiseren
  • Redeneren over acties en gebruikersinvoer
  • Geheugen gebruiken om context in te brengen
  • Leren op basis van feedback van gebruikers
  • Noteer uitzonderingsverzoeken en vraag om hulp.

Een voorbeeld van het nut dat zo'n agent zou kunnen bieden is een "order-taker" copiloot die volgens Microsoft "het volledige orderafhandelingsproces zou kunnen afhandelen - van het aannemen van de order tot het verwerken van de order en het doen van intelligente aanbevelingen en vervangingen voor artikelen die niet op voorraad zijn tot het verzenden naar de klant".

Met deze functie kun je virtuele werknemers aanmaken om ondergeschikte taken zoals het controleren van e-mails, gegevensinvoer of andere repetitieve taken uit te voeren zonder dat je extra personeel nodig hebt.

Phi-3 Visie

Microsoft heeft een multimodaal model met 4,2B parameters toegevoegd aan zijn Phi-3 familie van kleine taalmodellen (SLM's). Phi-3 Vision is een goedkoop en low-latency model met audio- en visiemogelijkheden en een 128k contextvenster.

Deze kleinere modellen zijn gericht op on-device oplossingen waar snelheid, kosten, rekenkracht en internetconnectiviteit beperkingen grotere modellen onpraktisch maken. De Phi-3 SLM's laten superieure redeneercapaciteiten zien en presteren beter dan verschillende grotere modellen.

Door multimodaal redeneren op apparaten mogelijk te maken, ontstaan interessante toepassingen in de gezondheidszorg, het onderwijs en de landbouw, met name in plattelandsgebieden zonder internetverbinding.

Je kunt Phi-3 Vision hier. Het kan heel goed afbeeldingen analyseren, tekst extraheren en zelfs vertalen.

Phi-3 Vision benchmark resultaten vergeleken met andere AI modellen. Bron: Microsoft

Geavanceerd plakken

Windows 11 heeft nu een slimmere manier om te kopiëren en plakken. De nieuwe functie Geavanceerd plakken geeft je meer opties voor gegevens die je naar het klembord kopieert. Als je op Windows-toets + Shift + V drukt, krijg je de opties om te plakken als platte tekst, als markdown of als JSON.

Je kunt ook een beschrijving typen van hoe je wilt dat de gekopieerde tekst wordt verwerkt voordat deze wordt geplakt.

Je hebt een OpenAI API-sleutel en credits in je account om deze functie te gebruiken. Het bespaart je alleen de moeite om de tekst te plakken in ChatGPT en vraag het om het daar te formatteren, voordat je het terug in je document kopieert en plakt.

Doe mee met de toekomst


SCHRIJF JE VANDAAG NOG IN

Duidelijk, beknopt, uitgebreid. Krijg grip op AI-ontwikkelingen met DailyAI

Eugene van der Watt

Eugene heeft een achtergrond in elektrotechniek en houdt van alles wat met techniek te maken heeft. Als hij even pauzeert van het consumeren van AI-nieuws, kun je hem aan de snookertafel vinden.

×

GRATIS PDF EXCLUSIEF
Blijf voorop met DailyAI

Meld je aan voor onze wekelijkse nieuwsbrief en ontvang exclusieve toegang tot DailyAI's nieuwste eBook: 'Mastering AI Tools: Your 2024 Guide to Enhanced Productivity'.

* Door u aan te melden voor onze nieuwsbrief accepteert u onze Privacybeleid en onze Algemene voorwaarden