Är Google Gemini redo att utmana OpenAI?

17 september 2023

Google AI

Google kastar handsken med Gemini, sin nya stora språkmodell (LLM). 

Gemini-projektet, som främst utvecklas av Google DeepMind, signalerar en kommande kraftmätning med OpenAI:s ChatGPT.

Informationen rapporterade att Google har gett tidig tillgång till Gemini för en utvald grupp utvecklare, vilket innebär att en betaversion är nära förestående. 

När Google kombinerar sina stora resurser med forskningslaboratorierna Brain och DeepMind kan Geminis potentiella inverkan på AI-industrin bli enorm.

Medan OpenAI har tagit steget in på AI-scenen och tagit kontroll över offentliga användare med ChatGPT, backas Google upp av decennier av AI-forskning och äger en stor mängd egenutvecklade dataset.

Googles VD Sundar Pichai presenterade Gemini under Google I/O:s utvecklarkonferens i maj 2023. Han sade att Gemini är utformad "från grunden för att vara multimodal" och kombinerar DeepMinds AlphaGo-systemstyrkor med kraftfulla språkmodelleringsfunktioner. 

Demis Hassabis, VD för DeepMind, lade till mer sammanhang och sade att Gemini inte är en enda modell utan snarare en "serie modeller" och att den sannolikt kommer att fungera med text, bilder och eventuellt även tal och ljud. 

Detta liknar inriktningen för Google Bard, som innehåller bildfunktionalitet med tillstånd av Google Lens. 

Framtida förbättringar kan inkludera funktioner som "minne och planering som kan möjliggöra uppgifter som kräver resonemang", enligt Pichai.

Googles Chief Scientist Jeffrey Dean avslöjade att Gemini kommer att använda Googles nya AI-infrastruktur, Pathways, för att skala upp sin träning på olika dataset. 

Dean antydde att systemet potentiellt skulle kunna överstiga storleken på OpenAI:s GPT-3, som innehåller över 175 miljarder parametrar - men det skulle innebära att Gemini fortfarande ligger en generation efter GPT-4. 

Antalet parametrar är dock inte allt, och Gemini kan skilja sig från andra LLM:er på andra sätt. 

Förutom att arbeta med flera datatyper angav Hassabis till exempel att Gemini kunde korsvalidera information med Google Search. 

Reaktion från branschen

Hassabis avslöjade att Gemini visar "mycket lovande tidiga resultat" i en september intervju med Time.

En rapport av Semi-analys uppger att Gemini överstiger 430 miljarder parametrar, vilket är betydligt högre än GPT-3:s uppskattning på 200 miljarder. Parameterantalet för GPT-4 är okänt, men det rapporteras vara omkring 1 biljon, enligt en handfull analyser.

Semi Analysis-inlägget hävdar också att Gemini kommer att "krossa" GPT-4: s förträningsflops med 5x, med planer på att slå den med 20x. Även om det är spekulativt, skulle detta innebära att Gemini är beräkningsmässigt betydligt kraftfullare än GPT-4. 

I inlägget står det: "Huruvida Google har mage att lägga ut dessa modeller offentligt utan att kastrera deras kreativitet eller deras befintliga affärsmodell är en annan diskussion."

Som Sundar Pichai sa kommer dagens chatbottar att "se triviala ut" i jämförelse inom några år. 

Huruvida Gemini kommer att bryta GPT-4:s dominans är dock fortfarande okänt.

Bli en del av framtiden


PRENUMERERA IDAG

Tydlig, kortfattad och heltäckande. Få grepp om AI-utvecklingen med DagligaAI

Sam Jeans

Sam är en vetenskaps- och teknikskribent som har arbetat i olika AI-startups. När han inte skriver läser han medicinska tidskrifter eller gräver igenom lådor med vinylskivor.

×

GRATIS PDF EXKLUSIV
Ligg steget före med DailyAI

Registrera dig för vårt veckovisa nyhetsbrev och få exklusiv tillgång till DailyAI:s senaste e-bok: "Mastering AI Tools: Din 2024-guide till förbättrad produktivitet".

*Genom att prenumerera på vårt nyhetsbrev accepterar du vår Integritetspolicy och våra Villkor och anvisningar