AI-agenter, multimodal Phi-3 afsløret på Microsoft Build 2024

22. maj 2024

  • Microsoft afslørede Team Copilot, et produktivitetsværktøj til samarbejde, på sin Build Developer Conference
  • Copilot Studio kan skabe AI-agenter til at automatisere funktioner på tværs af applikationer
  • Phi-3 Vision bringer billed- og lydmodaliteter til Phi-3-familien af små sprogmodeller

Satya Nadella brugte sin keynote på dag 1 af Microsofts Build Developer Conference til at annoncere nogle spændende nye AI-udviklinger, som snart vil være generelt tilgængelige.

Microsoft Build er en årlig konference, hvor udviklere får mulighed for at se den seneste udvikling i Windows 11 og Microsoft 365. På den første dag blev der afsløret nogle interessante generative AI-værktøjer.

Team Copilot

I 2023 udgav Microsoft sin Copilot chatbot, som giver intelligent hjælp i realtid, mens du arbejder med Microsoft 365-værktøjer som Word, Excel, PowerPoint, Outlook eller Teams.

Nadella annoncerede, at den ville få en betydelig AI-opgradering med Team Copilot. Hold Copilot udvider Copilot fra at være en individuel personlig assistent til at blive en del af et team, hvilket forbedrer samarbejdet og projektstyringen.

Hvis du arbejder som en del af et team, der bruger Microsoft Teams, Microsoft Loop eller Microsoft Planner, kan Team Copilot kan lette møder ved at styre dagsordenen og tage noter. Den kan fremhæve vigtige oplysninger, spore handlingspunkter og tage fat på uløste problemer.

Det kan endda fungere som en projektleder, der tildeler opgaver, sporer deadlines og giver besked til teammedlemmerne, når der er brug for deres input.

Tilpassede copilot-agenter

Microsoft Copilot Studio giver dig mulighed for at bygge brugerdefinerede copiloter, der fungerer som agenter, der arbejder selvstændigt, når du giver dem instruktioner.

Ved hjælp af en naturlig sprogprompt beskriver du blot, hvad du vil have agenten til at gøre, og implementerer det derefter på flere platforme.

Microsoft siger, at disse agenter kan:

  • Automatiser langvarige forretningsprocesser
  • Ræsonnerer over handlinger og brugerinput
  • Udnyt hukommelsen til at skabe sammenhæng
  • Lær på baggrund af brugerfeedback
  • Registrer anmodninger om undtagelser, og bed om hjælp.

Et eksempel på den nytte, en sådan agent kan give, er en "ordremodtager"-copilot, som ifølge Microsoft kan "håndtere hele ordreudførelsesprocessen - fra at tage imod ordren til at behandle den og komme med intelligente anbefalinger og erstatninger for varer, der ikke er på lager, til at sende den til kunden."

Denne funktion giver dig mulighed for at oprette virtuelle medarbejdere til at håndtere trivielle opgaver som overvågning af e-mails, dataindtastning eller andre gentagne opgaver uden at øge antallet af medarbejdere.

Phi-3 Vision

Microsoft har tilføjet en 4.2B parameter multimodal model til sin Phi-3 familie af små sprogmodeller (SLM'er). Phi-3 Vision er en billig model med lav latenstid, der har lyd- og synsfunktioner og et 128k kontekstvindue.

Disse mindre modeller er rettet mod løsninger på enheder, hvor begrænsninger i hastighed, pris, beregning og internetforbindelse gør større modeller upraktiske. Phi-3 SLM'erne viser overlegne ræsonnementsevner og overgår flere større modeller.

Mulighed for multimodal ræsonnering på enheden åbner for spændende anvendelser inden for sundhedspleje, uddannelse og landbrug, især i landområder uden internetforbindelse.

Du kan afprøve Phi-3 Vision her. Det gør et godt stykke arbejde med at analysere billeder, udtrække tekst og endda oversætte.

Phi-3 Vision-benchmarkresultater sammenlignet med andre AI-modeller. Kilde: Microsoft

Avanceret indsætning

Windows 11 har nu en smartere måde at kopiere og indsætte på. Den nye Advanced Paste-funktion giver dig flere muligheder for data, som du kopierer til udklipsholderen. Når du trykker på Windows Key + Shift + V, får du mulighed for at indsætte som almindelig tekst, som markdown eller som JSON.

Du kan også skrive en beskrivelse af, hvordan den kopierede tekst skal behandles, før du indsætter den.

Du skal bruge en OpenAI API-nøgle og kreditter på din konto for at bruge denne funktion. Det sparer dig bare for besværet med at indsætte teksten i ChatGPT og beder den om at formatere det der, før du kopierer og indsætter det i dit dokument igen.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser