AI-agenter, multimodal Phi-3 avduket på Microsoft Build 2024

22. mai 2024

  • Microsoft presenterte Team Copilot, et produktivitetsverktøy for samarbeid, på utviklerkonferansen Build
  • Copilot Studio kan lage AI-agenter for å automatisere funksjoner på tvers av applikasjoner
  • Phi-3 Vision tilfører bilde- og lydmodaliteter til Phi-3-familien av små språkmodeller

Satya Nadella brukte sin hovedtale på dag 1 av Microsofts utviklerkonferanse Build til å kunngjøre noen spennende nye AI-utviklinger som snart vil være allment tilgjengelige.

Microsoft Build er en årlig konferanse der utviklere får se den nyeste utviklingen i Windows 11 og Microsoft 365. Den første dagen ble det avduket noen interessante generative AI-verktøy.

Team Copilot

I 2023 lanserte Microsoft sin Copilot chatbot som gir intelligent hjelp i sanntid mens du jobber med Microsoft 365-verktøy som Word, Excel, PowerPoint, Outlook eller Teams.

Nadella kunngjorde at den skulle få en betydelig AI-oppgradering med Team Copilot. Team Copilot utvider Copilot fra å være en individuell personlig assistent til å bli en del av et team, noe som forbedrer samarbeidet og prosjektstyringen.

Hvis du jobber som en del av et team som bruker Microsoft Teams, Microsoft Loop eller Microsoft Planner, kan Team Copilot kan legge til rette for møter ved å administrere agendaen og ta notater. Den kan fremheve viktig informasjon, spore handlingspunkter og ta opp uløste problemer.

Den kan til og med fungere som en prosjektleder som tildeler oppgaver, sporer tidsfrister og varsler teammedlemmene når det er behov for deres innspill.

Egendefinerte copilot-agenter

Microsoft Copilot Studio gjør det mulig å bygge egendefinerte copiloter som fungerer som agenter som arbeider selvstendig etter at du har gitt dem instruksjoner.

Ved hjelp av en naturlig språkprompt kan du enkelt beskrive hva du vil at agenten skal gjøre, og deretter distribuere den på flere plattformer.

Microsoft sier at disse agentene kan det:

  • Automatiser langvarige forretningsprosesser
  • Resonnerer over handlinger og brukerinnganger
  • Utnytt minnet for å skape kontekst
  • Lær basert på tilbakemeldinger fra brukerne
  • Registrer forespørsler om unntak og be om hjelp.

Et eksempel på nytten en slik agent kan gi, er en "bestillingsagent" som ifølge Microsoft kan "håndtere hele ordrebehandlingsprosessen - fra å ta imot bestillingen til å behandle den og komme med intelligente anbefalinger og erstatninger for varer som ikke er på lager, til å sende den til kunden".

Med denne funksjonaliteten kan du opprette virtuelle medarbeidere som kan ta seg av enkle oppgaver som overvåking av e-post, dataregistrering eller andre repeterende oppgaver, uten at du trenger å øke antall ansatte.

Phi-3 Vision

Microsoft har lagt til en multimodal modell med 4,2 milliarder parametere i sin Phi-3 familie av små språkmodeller (SLM-er). Phi-3 Vision er en rimelig modell med lav latenstid, lyd- og synsfunksjoner og et kontekstvindu på 128 kB.

Disse mindre modellene er beregnet på løsninger på enheter der begrensninger i hastighet, kostnader, databehandling og Internett-tilkobling gjør det upraktisk med større modeller. Phi-3 SLM-ene viser overlegen evne til å resonnere og utkonkurrerer flere større modeller.

Muligheten for multimodal resonnering på enheten åpner for spennende bruksområder innen helse, utdanning og landbruk, spesielt i landlige områder uten internettforbindelse.

Du kan prøve ut Phi-3 Vision her. Den gjør en god jobb med å analysere bilder, trekke ut tekst og til og med oversette.

Phi-3 Vision-referanseresultater sammenlignet med andre AI-modeller. Kilde: Microsoft Microsoft

Avansert liming

Windows 11 har nå en smartere måte å kopiere og lime inn på. Den nye Advanced Paste-funksjonen gir deg flere alternativer for data som du kopierer til utklippstavlen. Når du trykker på Windows-tasten + Shift + V, får du opp alternativer for å lime inn som ren tekst, som markdown eller som JSON.

Du kan også skrive inn en beskrivelse av hvordan du vil at den kopierte teksten skal behandles før du limer den inn.

Du trenger en OpenAI API-nøkkel og kreditter i kontoen din for å bruke denne funksjonen. Det sparer deg bare for bryet med å lime inn teksten i ChatGPT og ber den om å formatere det der, før du kopierer og limer det inn i dokumentet igjen.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Eugene van der Watt

Eugene har bakgrunn som elektroingeniør og elsker alt som har med teknologi å gjøre. Når han tar en pause fra AI-nyhetene, finner du ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser