AI-agenter, multimodala Phi-3 presenterade på Microsoft Build 2024

22 maj 2024

  • Microsoft presenterade Team Copilot, ett produktivitetsverktyg för samarbete, på sin utvecklarkonferens Build
  • Copilot Studio kan skapa AI-agenter för att automatisera funktioner i olika applikationer
  • Phi-3 Vision tillför bild- och ljudmodaliteter till Phi-3-familjen med små språkmodeller

Satya Nadella använde sin keynote på dag 1 av Microsofts Build Developer Conference för att tillkännage några spännande nya AI-utvecklingar som snart kommer att vara allmänt tillgängliga.

Microsoft Build är en årlig konferens där utvecklare får ta del av den senaste utvecklingen inom Windows 11 och Microsoft 365. Under den första dagen presenterades några intressanta generativa AI-verktyg.

Team Copilot

År 2023 släppte Microsoft sin Copilot chatbot som ger intelligent hjälp i realtid när du arbetar med Microsoft 365-verktyg som Word, Excel, PowerPoint, Outlook eller Teams.

Nadella meddelade att den skulle få en betydande AI-uppgradering med Team Copilot. Team Copilot expanderar Copilot från en enskild personlig assistent till att bli en del av ett team, vilket förbättrar samarbetet och projekthanteringen.

Om du arbetar som en del av ett team med Microsoft Teams, Microsoft Loop eller Microsoft Planner kan Team Copilot kan underlätta möten genom att hantera dagordningen och föra anteckningar. Den kan lyfta fram viktig information, spåra åtgärder och ta upp olösta frågor.

Det kan till och med fungera som en projektledare som fördelar uppgifter, håller koll på deadlines och meddelar teammedlemmarna när deras insatser behövs.

Anpassade copilot-agenter

Microsoft Copilot Studio gör det möjligt för dig att bygga egna copiloter som fungerar som agenter som arbetar självständigt efter att du har gett dem instruktioner.

Med hjälp av ett naturligt språkmeddelande beskriver du helt enkelt vad du vill att agenten ska göra och distribuerar det sedan på flera plattformar.

Microsoft säger att dessa agenter kan:

  • Automatisera långvariga affärsprocesser
  • Resonera kring åtgärder och användarinmatningar
  • Utnyttja minnet för att skapa sammanhang
  • Lär dig baserat på feedback från användarna
  • Registrera undantagsförfrågningar och be om hjälp.

Ett exempel på den nytta en sådan agent skulle kunna ge är en copilot som enligt Microsoft skulle kunna "hantera hela orderhanteringsprocessen - från att ta emot beställningen till att bearbeta beställningen och ge intelligenta rekommendationer och ersättningar för artiklar som inte finns i lager till att skicka den till kunden".

Med den här funktionen kan du skapa virtuella medarbetare som sköter enklare uppgifter som e-postbevakning, datainmatning eller andra repetitiva uppgifter utan att öka antalet anställda.

Phi-3 Vision

Microsoft har lagt till en multimodal modell med 4.2B parametrar i sin Phi-3 familj av små språkmodeller (SLM). Phi-3 Vision är en modell med låg kostnad och låg latens som har ljud- och bildfunktioner och ett kontextfönster på 128 kB.

Dessa mindre modeller är avsedda för lösningar på enheter där begränsningar i fråga om hastighet, kostnad, beräkning och internetanslutning gör större modeller opraktiska. Phi-3 SLM:erna uppvisar överlägsen resonemangsförmåga och överträffar flera större modeller.

Genom att möjliggöra multimodala resonemang på enheten öppnas spännande tillämpningar inom sjukvård, utbildning och jordbruk, särskilt på landsbygden där det inte finns någon internetuppkoppling.

Du kan prova att Phi-3 Vision här. Det gör ett bra jobb med att analysera bilder, extrahera text och till och med översättning.

Benchmarkresultat för Phi-3 Vision jämfört med andra AI-modeller. Källa: Microsoft Microsoft

Avancerad pasta

Windows 11 har nu ett smartare sätt att kopiera och klistra in. Den nya funktionen Advanced Paste ger dig fler alternativ för data som du kopierar till urklippet. När du trycker på Windows Key + Shift + V får du alternativ för att klistra in som vanlig text, som markdown eller som JSON.

Du kan också skriva en beskrivning av hur du vill att den kopierade texten ska bearbetas innan du klistrar in den.

Du behöver en OpenAI API-nyckel och krediter i ditt konto för att använda den här funktionen. Det sparar dig bara besväret med att klistra in texten i ChatGPT och be den formatera den där, innan du kopierar och klistrar in den i dokumentet igen.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Eugene van der Watt

Eugene kommer från en bakgrund som elektronikingenjör och älskar allt som har med teknik att göra. När han tar en paus från att konsumera AI-nyheter hittar du honom vid snookerbordet.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar