Microsoft bygger angivelig en 500B LLM kalt MAI-1

Ifølge en rapport fra The Information jobber Microsoft med en 500B parameter LLM kalt MAI-1 som kan ta opp kampen med GPT-4 og Googles Gemini modeller.

Vi rapporterte nylig om Microsofts Phi-3 Mini familie av små språkmodeller med alt fra 3,8 B til 14 B parametere. MAI-1 har 500 B parametere og blir dermed den største modellen Microsoft har tatt i bruk.

Størrelsen plasserer den i samme størrelsesorden som GPT-4 og Googles større Gemini modeller. Det ryktes at GPT-4 har 1,76T parametere, men det er en Mixture of Experts (MoE)-modell, så bare rundt 280B parametere er i spill under inferens.

Det er ingen informasjon tilgjengelig om arkitekturen til MAI-1, men hvis det er en tett modell, i motsetning til MoE, så kommer den til å bli ganske kraftig. Metas forventede Llama 3-modell forventes å ha 400B parametere.

Utviklingen av MAI-1 ledes av Mustafa Suleyman, medgrunnlegger og tidligere leder for anvendt AI ved DeepMind.

Mustafa forlot DeepMind for å være med å grunnlegge AI-oppstartsselskapet Inflection i 2022. I mars i år ansatte Microsoft majoriteten av de ansatte i Inflection og betalte $650 millioner for rettighetene til selskapets IP.

MAI-1 er tilsynelatende et helt nytt Microsoft-prosjekt, og ikke en videreføring av et eksisterende Inflection-prosjekt. Det er ikke sagt noe om en lanseringsdato, men vi får kanskje se en forhåndsvisning av MAI-1 den 16. mai på Microsofts Build-utviklerkonferanse.

Microsoft er OpenAIDet faktum at de utvikler sine egne LLM-programmer for å konkurrere med de andre OpenAI er litt overraskende for noen. Sikrer Microsoft seg, forfølger de flere utviklingsstrategier, eller er det noe helt annet?

Microsofts CTO Kevin Scott prøvde å bagatellisere problemet. I et innlegg på LinkedIn sa Scott: "Jeg er ikke sikker på hvorfor dette er nyheter, men bare for å oppsummere det åpenbare: vi bygger store superdatamaskiner for å trene AI-modeller; vår partner Open AI bruker disse superdatamaskinene til å trene grensedefinerende modeller; og så gjør vi begge disse modellene tilgjengelige i produkter og tjenester slik at mange mennesker kan dra nytte av dem. Vi liker denne ordningen godt."

Scott mener kanskje alvor med denne uttalelsen, men når MAI-1 lanseres, kan det føre til at Microsoft blir en direkte konkurrent til selskapet som de har investert milliarder av dollar i.

Vil MAI-1 bli lansert akkurat i tide til OpenAI for å overgå den ved å lansere GPT-5? OpenAI hadde planlagt et arrangement denne torsdagen der det var forventet at selskapet skulle dele oppdateringer og produktdemonstrasjoner, men arrangementet har siden blitt utsatt.

Med mystiske GPT-2-chatboter dukker opp, forsvinner og dukker nå opp igjen, Microsoft bygger enorme modeller, og OpenAI AI-dramaet holder oss på pinebenken.

Microsoft bygger angivelig en 500B LLM kalt MAI-1

Bli med i fremtiden

Eugene van der Watt

RELATERTE ARTIKLER

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Microsoft bygger angivelig en 500B LLM kalt MAI-1

Bli med i fremtiden

Eugene van der Watt

RELATERTE ARTIKLER

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

GRATIS PDF EKSKLUSIVHold deg i forkant med DailyAI

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI